莱昂纳多
Roger F. Malina,建议编辑
肖恩·库比特,主编
合成材料:1956-1975 年澳大利亚的艺术与技术方面,斯蒂芬·琼斯,2011 年
混合文化:与西方对话的日本媒体艺术,伊冯娜·斯皮尔曼,2012
行走和制图:作为制图师的艺术家,Karen O'Rourke,2013
现代艺术中的第四维和非欧几何,修订版,Linda Dalrymple Henderson,2013
运动中的幻觉:运动全景和相关景观的媒体考古学,Erkki Huhtamo,2013
重温:媒体艺术史,由 Sean Cubitt 和 Paul Thomas 编辑,2013
重新收集:艺术、新媒体和社会记忆,Richard Rinehart 和 Jon Ippolito,2014
Biopolitical Screens: Image, Power, and the Neoliberal Brain , Pasi Väliaho, 2014
光的实践:从版画到像素的视觉技术谱系,肖恩·库比特,2014
我们时代的基调:声音、感官、经济和生态,弗朗西丝·戴森,2014
体验机器:Stan VanDerBeek 的 Movie-Drome 和扩展影院,Gloria Sutton,2014
Hanan al-Cinema:对动态影像的热爱,Laura U. Marks,2015
写作和不写作(媒体)艺术史:2048 年的 Erkki Kurenniemi,由 Joasia Krysa 和 Jussi Parikka 编辑,2015
控制:作为文化逻辑的数字化,Seb Franklin,2015
新趋势:信息革命门槛上的艺术(1961-1978),Armin Medosch,2016
屏幕生态学:亚太地区的艺术、媒体和环境,Larissa Hjorth、Sarah Pink、Kristen Sharp 和 Linda Williams,2016 年
海盗哲学:数字后人类,加里·霍尔,2016
社交媒体考古学和诗学,朱迪·马洛伊编辑,2016
实用:从参与到当代艺术互动, Samuel Bianchini 和 Erik Verhagen 编辑,2016
二十世纪的机器艺术,安德烈亚斯·布罗克曼,2016
Here/There: Telepresence, Touch, and Art at the Interface , Kris Paulsen, 2017
声轨:在媒体和艺术中调和声音,诺里纽马克,2017
欣喜若狂的世界:媒体、乌托邦、生态学,Janine Marchessault,2017
作为乌托邦的界面:弗雷德森林的媒体艺术和行动主义,迈克尔·F·勒鲁斯,2017
有意义:艺术、计算、认知和体现,Simon Penny,2017
天气作为媒介:迈向气象艺术,珍妮·兰德森,2018
实验室生活方式:科幻小说的构建,由 Sandra Kaji-O'Grady、Chris L. Smith 和 Russell Hughes 编辑,2018
看不见的颜色:原子时代的艺术,Gabrielle Decamous,2018
虚拟动物园:动物作为网络文化的中介,乔迪·伯兰德,2019
从手指到数字:人工美学,Ernest Edmonds 和 Margaret A. Boden,2019
材料证人:媒体、取证、证据,Susan Schuppli,2020
交互策略:对艺术和技术的编码影响,Ksenia Fedorova,2020
让身体回归数据:磁共振技术中的图像制造者、拼凑和重塑,Silvia Casini,2021 年
像素传记,Alvy Ray Smith,2021
请参阅http://mitpress.mit.edu以获取本系列的完整标题列表。
阿尔维·雷·史密斯
麻省理工学院出版社
马萨诸塞州剑桥
伦敦,英国
© 2021 麻省理工学院
版权所有。未经出版商书面许可,不得以任何电子或机械方式(包括影印、录音或信息存储和检索)以任何形式复制本书的任何部分。
麻省理工学院出版社要感谢对本书草稿提供意见的匿名同行审稿人。学术专家的慷慨工作对于确立我们出版物的权威性和质量至关重要。我们衷心感谢这些未经授权的读者的贡献。
本书由 New Best-set Typesetters Ltd. 在 ITC Stone Serif Std 和 ITC Stone Sans Std 中设置。
美国国会图书馆出版数据编目
姓名:Smith, Alvy Ray, 1943– 作者。
标题:像素传记 / Alvy Ray Smith。
描述:马萨诸塞州剑桥:麻省理工学院出版社,[2021] | 系列:莱昂纳多 | 包括参考书目和索引。
标识符:LCCN 2020029699 | ISBN 9780262542456(平装本)
科目: LCSH:电脑动画——历史。
分类:LCC TR897.7 .S52 2021 | DDC 777/.7—dc23
LC 记录可在https://lccn.loc.gov/2020029699
10 9 8 7 6 5 4 3 2 1
d_r1
至
艾莉森,我心爱的妻子
山姆和杰西,我亲爱的儿子们
和
Leo、Attie、Georgie、Augie 和 Evelyn,我受人爱戴又脾气暴躁的孙子们
莱昂纳多,国际艺术、科学和技术协会,以及附属的法国组织莱昂纳多协会,有一些非常简单的目标:
当莱昂纳多杂志大约五十年前开始,这些创造性学科通常存在于隔离的机构和社会网络中,当时由 CP Snow 发起的“两种文化”辩论戏剧化了这种情况。今天,我们生活在一个由新的混合组织、新的资助者以及计算机和互联网的共享工具促成的跨学科发酵、协作和智力对抗的不同时代。有时在“STEM to STEAM”运动中被捕捉到,新的合作形式似乎将艺术、人文和设计与科学和工程实践相结合。最重要的是,新一代的艺术家研究人员和研究艺术家现在正在单独和协作地连接艺术、科学和技术学科。对于我们社会的一些难题,我们别无选择,只能找到将艺术与科学结合起来的新方法。也许在我们的有生之年,我们会看到“新莱昂纳多斯”的出现,这种混合创意的个人或团队不仅会为我们的时代开发出有意义的艺术,而且还会推动科学的新议程并刺激满足当今人类需求的技术创新。
有关莱昂纳多组织和网络活动的更多信息,请访问我们的网站http://www.leonardo.info/和http://www.olats.org/。亚利桑那州立大学莱昂纳多知识企业为推进亚利桑那州立大学的跨学科艺术科学研究、创意实践和该领域的国际形象提供了领导力:https ://leonardo.asu.edu/ 。
罗杰·F·马利纳
建议编辑,莱昂纳多出版物
图 0.1
步行野猪,阿尔塔米拉,约公元前 20,000 年。
你不可为你雕刻任何偶像,或任何在天上,或在地下,或在地底下水中的任何东西的像。
——出埃及记 20:4,詹姆士王版
一开始——肯定早于圣经禁忌——一个被火焰点燃的雕刻图像似乎在移动。西班牙阿尔塔米拉洞穴墙壁上的一幅画是一只行走的野猪,以及一位古代艺术家在其上绘画的岩石以及使用的木炭和赭石颜料(图 0.1)。20 千年左右的时间里,世界上没有其他地方可以看到那只圣经前的猪。只有在旧石器时代电影院闪烁的火光中,你才能看到它的腿移动和头部摆动。1
甚至直到 1800 年,也就是两个世纪前,一张拿破仑穿越阿尔卑斯山的照片和雅克-路易·大卫 (Jacques-Louis David) 画在上面的画布和他使用的油画颜料是一个不可或缺的单元。想象一下,您想与纽约的朋友分享拿破仑在欧洲令人愉快的传记照片(图 0.2)。那时还没有手机和摄像机,甚至连照片之类的东西都没有。在纽约展示他的唯一方法是将一幅实物画运送到那里——如果你敢的话。雕刻、蚀刻或素描可能会有所帮助,但这些只是更好或更差的副本——新图像永远不会完全忠实地捕捉原件。2
在那段时间里,一幅画和它的创作媒介是密不可分的。甚至没有人想过将两者分开。独立于媒介的图片会是什么?
然后在 19 世纪初发明了摄影,开创了我们现在所说的“媒体”世界。忠实的繁殖就在我们身上。电影出现在 19 世纪末,电视出现在 20 世纪初。那时所有的媒体都是模拟的——流畅和连续。一张图片可以从一种媒体转移到另一种媒体——这暗示着,一张图片毕竟是从它的媒体中分离出来的。
直到 1933 年,数字的概念——离散和尖峰——才完全存在。在 1950 年的世纪中叶,只有几张数字图片存在。少数了解它们的人实际上认为它们是对更严肃的数字计算机项目的无聊干扰。世界上所有其他图片都是用模拟方式制作和观看的——画布上的油、纸上的墨水和胶卷上的化学乳剂,仅举几例。
但在千禧年,即 2000 年,发生了一件鲜为人知的事件——大数字融合:一种新的数字媒体——无所不包的比特——几乎取代了所有的模拟媒体。比特成为了通用媒介,而像素——一种特殊的比特包装——征服了世界。可以说,从画布上移除一幅画成为可能。因此,世界上大多数图片现在都是数字的。与无处不在的数字图像相比,模拟图像几乎消失了。博物馆和幼儿园是为数不多的可以找到类似物的可靠场所。
这本书通过庆祝数字光来预示着千禧年的事件——包括任何图片的广阔领域,用于任何目的,由像素制成。它从停车计时器延伸到虚拟现实,从仪表板到数字电影和电视,从 CAT 扫描到视频游戏再到手机显示屏,等等——任何以像素为媒介的事物。
新媒体令人困惑的是你看不到它。位和由位组成的像素是不可见的。不要像通常那样将像素与小像素混淆屏幕上的发光区域,称为显示元素。本书的技术核心是解释如何使由不可见的东西组成的图片可见——如何将数字像素转换为模拟显示元素。
图 0.2
雅克-路易·大卫,拿破仑穿越阿尔卑斯山,1801 年。
千禧年发生的大数字融合只是一个巧合,而是一个方便的巧合。皮克斯于 1995 年发行了第一部数字电影《玩具总动员》。新的高清电视 (HDTV) 信号的首次播出是在 1998 年。1999 年,一款质量足以威胁胶片相机的数码相机震惊了市场。光盘或 DVD 于 2000 年首次亮相。Apple 于 2007 年推出了无处不在的 iPhone。曾经的墨水和纸张、照片、电影和电视在历史的一瞬间变成了比特。变化如此之快,以至于今天的年轻人可能从未体验过非数字媒体——除了那些模拟的最后堡垒:艺术博物馆和幼儿园。
我们现在都沉浸在像素的海洋中。我随身携带了数十亿个,我怀疑你也这样做了。但奇怪的是,我们日常经验中这种普遍的变化几乎没有引起人们的重视。也许这是因为大多数人还没有意识到 Digital Light 是一种单一的统一技术。这个概念是新的。讲清楚是本书的主要目的。
只有三个想法——波、计算和像素——构成了数字光所有明显复杂性的基础。每个想法在直觉上都是简单、深刻和美丽的。这些是我们现代世界的技术基石,你不需要数学来理解它们。前三章(本书的第一部分)介绍了这些基本思想,以及使它们成为可能的人们的令人惊讶和引人入胜的故事。
Waves 是一个模拟的想法。您可能知道音乐是由不同频率(音高)和幅度(响度)的同时声波组成的。两个世纪前,法国人约瑟夫·傅立叶将这一概念扩展到我们所有的感官体验。我们看到和听到的一切都是波的总和。都是音乐。在本书中,我将向您展示如何在视觉场景中观看音乐。
计算机是一种数字概念。使计算快速进行的机器是日常生活中数字化的典范。但是计算的概念只能追溯到 1936 年,当时英国人艾伦·图灵发明了它,以捕捉谨慎、精确过程的概念。这可能听起来乏味乏味,但后果绝不是这样。计算机是人类最具延展性的工具。还有他们惊人的速度是有史以来最重要的工程奇迹。以这样的速度,计算机将我们微不足道的人类可以做的事情放大到难以想象的程度。
但是计算机的所有令人难以置信的、改变世界的能力实际上都归结为在两个状态之间小心翻转,通常被命名为 0 和 1。计算都是比特。这听起来可能微不足道,但我希望用计算中固有的意想不到的美丽和神秘来激发你的灵感。同样,不需要数学。
三个基本思想中最重要但鲜为人知的是本书的基本主题:你可以在波和比特之间来回穿梭——在模拟世界和数字世界之间。这个想法只能追溯到 1933 年,当时俄罗斯人 Vladimir Kotelnikov 建立了我们今天所知的它。它的正式名称是采样定理。整本书——作为像素的传记,像素是我们对视觉世界样本的名称——都是关于采样的。像素是代表可见波的不可见位。我的热切意图是让您了解这件魔法,并对它的工作原理感到惊讶。这里也不需要数学。
既然我已经在两页中说过三次不需要数学,你可能会想:但是如果我们中的一些人关心数学怎么办?对于您——但实际上对于我所有的读者——我在http://alvyray.com/DigitalLight上提供了一个在线注释站点。在那里,您将找到有关人物、地点和事件的更多详细信息,这些细节会使这本书过于笨拙,无法在其物理封面之间进行放置——您还将找到支持 Digital Light 魔力的数学方程式和使之成为可能的像素. 3
一个常见的误解是像素是一个小方块颜色。但事实上,像素是一个深刻而抽象的概念,将我们现代媒体世界联系在一起。这是Digital Light的组织原理。
一个视觉场景由无数个颜色点组成。根据定义,无限是太大而无法处理的。那么,我们如何才能用有限数量的离散位(像素)来替换平滑的视觉场景,而不会丢失它们之间的无限信息呢?采样定理告诉我们如何去做。这是使现代媒体世界运转的秘密。
依赖于傅立叶波的采样几乎是在 1930 年代中期与计算同时创建的。采样遇到了计算并孕育了一个孩子,Digital Light,这本书的主题。
本书的第二部分专门介绍了塑造数码光的两项高科技的历史:计算机和电影。与第一部分一样,我直观地介绍了每项技术,并讲述其发明的历史——揭穿一些常见的神话。真实的故事总是比神话更有趣、更鼓舞人心、更复杂。
在 Digital Light 中,我们可以从现实世界中获取像素——例如,从国际空间站上的摄像头跟踪最新的飓风。但更重要的是,对于这本书,我们还可以从头开始制作像素。这就是计算机的用武之地,也是我如此详细地介绍高科技发展的原因。
我为这本书所做的研究中的许多惊喜之一是发现第一个像素出现在第一台计算机上。他们是一起出生的。因此,通过确定哪些计算机是世界上第一台计算机,我们还可以了解谁拥有世界上第一台像素。这就是为什么第二部分中关于计算机的章节被称为“数字光的黎明:加速”的原因。它展示了 1947 年用像素制作的第一张图片。它引入了一个巨大力量的驱动概念,称为摩尔定律:
计算机的任何优点每五年就会提高一个数量级。
尽管它很简单,但这种说法是革命性的。1965 年戈登摩尔宣布它时的 1 倍,现在约为 1000 亿,到 2025 年将达到 1 万亿。这是一颗爆炸的超新星。摩尔定律是 50 多年来所有计算机发展背后的强大动力,包括 Digital Light。
Digital Light的数字电影部分来源于经典电影。标题为“电影和动画:采样时间”的章节回顾了这种前数字运动图像技术。它还有助于进一步说明采样:我们熟悉的闪烁胶片“帧”实际上是一个示例。
动词take和make 也适用于电影。我们用相机从现实世界的场景中拍摄经典电影。我们根据非现实世界的图画制作经典动画电影。这两种电影的核心奥秘在于它们为什么应该有效。一系列静止帧如何传递运动和情感?至少,采样定理有助于解释运动。第一部数字电影——例如皮克斯的《玩具总动员》 ——是经典动画电影的数字继承者。
Digital Light 的故事太大,无法在一本书中涵盖,因此必须重点关注这一点。它涵盖了从世纪中叶的第一个像素到千禧年的第一部数字电影的数字光。不出所料,我选择写我从个人经验中最了解的特定技术、人物和历史。我出生在计算机和像素之前,我的职业生涯主要致力于创造第一部数字电影。但是选择的路径可以帮助解释数字光是如何变得更普遍的。电子游戏和虚拟现实并没有那么遥远。
第三部分的三章讲述了数码光在黎明后的故事(在第 4 章中讲述)和那些第一个世纪中叶的像素。1965 年的摩尔定律将它们清晰地分为摩尔定律之前的数字光时代 1 和之后的时代 2。标题为“即将到来的事物的形状”的章节专门介绍了第 1 纪元。另外两章“意义的阴影”和“千年与电影”涵盖了第 2 纪元中摩尔定律带来的巨大变化。
时代 1 是计算机的巨大时代,但速度非常慢。一些幸运的人可以接触到那些昂贵的野兽。从这一时期开始出现计算机图形学的中心法则:在计算机内部使用三维欧几里得几何和牛顿物理学来描述一个虚构的世界。然后它被一个虚拟相机观察到,它把它的世界观渲染成文艺复兴视角的二维显示。
我或多或少地涵盖了 Epoch 2 直到 2000 年。千禧年的高潮是皮克斯、梦工厂和蓝天这三个伟大的数字电影工作室的崛起。他们的故事交织在一起。
我不指望你在读完这本书后就能创作出一部数字电影,但我希望你能明白这是怎么可能的。这就像一堂音乐鉴赏课:学会了音乐原理后,你将无法自己为大提琴谱写巴赫组曲,但你会更好地理解这些组成部分,从而更爱巴赫。了解像《玩具总动员》这样的现代电影是如何制作的可以产生同样的效果。
从我对本书技术史的研究中得出了几个共同的主题:
举一个例子,约瑟夫·傅立叶有一个伟大的想法,即一个连续统一体,比如一个视野,就是所有的音乐。这只是波的总和。法国大革命的混乱让他在巴黎登上了世界舞台,拿破仑的崛起给了他工作的机会。拿破仑本人就是将傅立叶流放到乡下的暴君让他远离巴黎。在这个受保护的地方很长一段时间,傅立叶将他的想法发展成波理论,最终他回到了巴黎。他的想法影响了所有随后的科学和技术——尤其是数字光。
为了避免这种简单化的叙述陷阱,我依靠家谱。对于每项技术的历史,我设计了一个家庭流程图——一种图形设备,看起来很合适——用于涉及的人、地点、想法和机器。该图表显示了谁从谁那里得到了什么(无论是不择手段还是不择手段)以及玩家阵容之间经常密集的相互作用。几乎没有一个人可以从一个人那里得到其他一切。从一个图表流向另一个图表,然后到另一个图表。我们看着不同的股线以不同的方式编织在一起以影响下一代。因此,每一章都成为其流程图的扩展标题,并通过相关人员的详细故事和他们想法的直观呈现来增强。
现在让我们开始我们的两个世纪之旅,大约在大卫的著名画作纪念的时候——但拿破仑的肖像画却远没有那么讨人喜欢。
科学院有一位著名的傅立叶,后人已经忘记了他。
——维克多·雨果,《悲惨世界》1
你知道傅里叶吗?
答案使我们分裂。如果你说是,那么你可能在科学或技术领域。你今天可能已经使用了他的好主意。如果你从事艺术或人文学科,你可能从未听说过他。然而,他的想法是美丽、优雅和普遍的。它改变了我们的世界。2
但是,即使您确实回答了“是”,您也可能对这个人本人一无所知。所以维克多雨果在这方面做得对。后人忘记了傅立叶。
例如,很少有人知道约瑟夫·傅立叶在法国大革命中几乎失去了理智。或者拿破仑波拿巴带他去埃及探险,发现了罗塞塔石碑。或者他在解密过程中指导了让-弗朗索瓦·商博良。或者说他介绍了地球温室效应的研究。或者,当女性不做数学时,他支持最早的女数学家之一索菲·热尔曼。
正如我在引言中提到的,技术突破经常发生,当以下因素在某种程度上存在时:一个伟大的科学思想,某种混乱,以及一两个暴君。
傅立叶在动荡的生活中提出了他的伟大想法。他的决定性暴君是拿破仑,他先提拔了他,然后放逐了他。这次升职让傅立叶有动力去思考他的好主意。Exile 给了他解决问题的空间。
他的想法一开始是一个单一的科学种子,一个热理论。然后,它在随后的两个世纪中发展成为数千种技术解决方案。这是像素背后的中心思想。
傅立叶的伟大想法是:世界就是音乐。都是海浪。
这种音乐洞察力导致了广播,这也许不足为奇。但它也导致了电视。事实上,在它的众多后代中,全是媒体技术——所有最近在大数字融合期间合并的各种媒体。简而言之,傅里叶的伟大思想风靡世界,催生了现代媒体的所有雷电。
但它比这更普遍,远远超出媒体。几乎没有一个科学和技术分支不受它的影响——电学和磁学、光学、X 射线衍射、概率论、地震分析和量子力学。名单还在继续。毫不夸张地说,傅立叶改变了我们对世界的理解。
无论您坐在文化过道的哪一边,您都可能认识艾萨克·牛顿和阿尔伯特·爱因斯坦。世界在他们的有生之年认可了牛顿的万有引力理论和爱因斯坦的相对论。但在过去的 200 年里,只有物理学家和工程师才能让傅里叶的火焰保持活力。他们知道傅立叶是家长,并据此庆祝他。他们的工作,在许多不同的领域,展示了傅里叶波浪思想的伟大和普遍性。
傅立叶本人只迈出了关键的第一步。他是第一个以数学方式提出这个想法并通过实验对其进行测试的人。尽管他提出了几乎所有科学领域都会产生数千种解决方案的解释,但他自己只培育了第一朵花,即他对固体热流的解决方案。
这种不浪漫的专业是他延迟认可的一个很好的理由。他因其关于热如何流动的理论而成为“科学院著名的傅立叶”。它不像爱因斯坦关于引力是时空扭曲的概念那样充满诗意。
然而,傅立叶的伟大想法对于现代经验来说远比爱因斯坦的更重要。以它的音乐形式来说,它就像时空扭曲一样可爱——而且更直观。它没有理由隐藏在它通常难以理解的数学外衣后面。
是时候扭转雨果的评价,庆祝这个人和他的好主意了。无处不在的现代数字光技术是最终给予傅立叶应得的正确工具。
让·约瑟夫·傅立叶于 1768 年 3 月 21 日出生于巴黎东南约一百英里的古老省会欧塞尔。十年之内,他的父母死了,留下他和他的十四个兄弟姐妹成为孤儿。革命风起云涌。这个新的美国国家只有一岁,本杰明富兰克林在巴黎用他的浣熊皮帽和调情的方式吸引了他们。3
孤儿傅立叶有一些特别之处,欧塞尔的好人确保这个有才华的孩子受到教育。他们把他安置在一所由约瑟夫·帕莱(Joseph Pallais)经营的学校里,帕莱以曾是让-雅克·卢梭的音乐老师而闻名。唉,没有证据表明发现世界音乐的人本身就是音乐家。
傅立叶随后在他的家乡欧塞尔参加了皇家军事学院(法国全境有 11 个这样的学院分支机构)。当地支持者再次帮助资助了他。这些军校一致强调科学和数学,傅立叶尤其偏爱数学——疯狂地如此。
13 岁时,他收集烛台点燃一个大“橱柜”,并将他的数学研究延伸到凌晨,直到“熄灯”。令人窒息的——而且肯定是冰冷的——橱柜损害了他余生的健康。也许那个橱柜首先让他对热产生了特殊的兴趣。
但橱柜里的烛光课外训练很快就得到了回报。他获得了数学学生奖。这项技能开启了他的科学生涯,并最终使他不朽。然而,他还获得了修辞方面的一等奖,使他的政治生活成为可能,并直接导致他早日与死亡擦肩而过。在数学技能有机会发展之前,他的口语技巧几乎要了他的命。
危险一开始并不明显。进一步的军校训练可能直接将他带入了军队,但他肯定不是军人类型。一方面,他病得很重,而且是个数学怪胎。于是,在皇家军事学院完成学业后,他进入了教堂。他成为欧塞尔修道院的一名新手,并在那里向其他新手教授数学。大约在这个时候,他将自己的名字神圣化给了让·巴蒂斯特·约瑟夫·傅立叶,这是他此后使用的形式。
傅立叶在法国大革命前夕消失在修道院中。他幸存下来的几封信表明他隐约意识到这一点,但无动于衷。他更担心自己的名声和代数论文的状况,而不是法国的状况。“昨天是我的 21 岁生日。在那个年纪,”他在 1789 年 3 月的一封信中苦恼地说,“牛顿已经获得了许多不朽的主张。”
9 月,他又写了一封信,哀叹代数论文的命运。在这两封信之间,革命已经开始。但 9 月的信中没有提到那些动荡的事件。
然而,傅里叶的私人世界在那之后确实开始发生变化。他于 12 月在巴黎科学院提交了一篇关于“代数方程”的论文——大概是让他非常担心的那篇论文。
他没有宣誓就离开了修道院。无论如何,革命政府很快就镇压了宗教秩序。
然而,傅立叶在接下来的三年里并不是革命者。他改为在欧塞尔教数学。特别是,他没有签署欧塞尔革命人民协会向巴黎国民公会要求审判国王路易十六的请愿书。
但在 1793 年初,就在国王被斩首一个月后,我们开始听到公民傅立叶的来信。
众所周知,法国大革命的黎明令华兹华斯着迷,而年轻的傅立叶在他迟来的拥抱它后,在同一个天堂中欢欣鼓舞。他的话比诗人的更笨拙:“可以设想在我们中间建立一个不受国王和教士影响的自由政府的崇高希望。” 但他同样充满热情:“我很容易就迷上了这项事业,在我看来,这是任何国家所从事的最伟大、最美丽的事业。” 5
傅立叶不必从这些情绪跳到政治本身。1793 年 2 月,他在欧塞尔的革命公社发表了激动人心的首次演讲。他有一个为共和国军队招募当地新兵的计划。欧塞尔大众社会给他留下了深刻的印象,采纳了他的计划并邀请他加入。恐怖统治现在已经全面展开——最终有一万多人被斩首,被怀疑是国家的敌人。他明智地接受了“邀请”。
但天真的傅立叶——最近的新手——立刻就犯了错误,他的时机已经很糟糕了。他那受过修辞训练的舌头让他陷入了严重的麻烦。他不明智地用它来保护奥尔良的三个公民。不明智,因为他们已经在罗伯斯庇尔的敌人名单上,而罗伯斯庇尔是恐怖分子的“沙皇”。
革命者迅速解除了傅立叶在欧塞尔以外的所有职责。由于无法进一步推进共和国,他苦苦挣扎,跋涉到巴黎,亲自会见罗伯斯庇尔为他的案子辩护。这种大胆的策略适得其反。他对奥尔良囚犯的支持使他在罗伯斯庇尔的敌人短名单上占有一席之地。由于革命的扭曲逻辑,尽管欧塞尔一直支持的公民提出抗议,但傅里叶所倡导的恐怖行动还是在 1794 年 7 月 17 日将他送进了监狱。这实际上是死刑。
“我经历了各种程度的迫害和不幸,”他说。“我的对手没有一个比这更危险,我是我们同胞中唯一被判处死刑的人。” 6
几天之内,下一站将是巴黎的革命法庭和断头台上的橡皮图章。他有理由感到害怕。他不可能知道仅仅十天之后——7 月 27 日,或者 9 日,法国大革命时间——罗伯斯庇尔会重重摔倒。那个叫人头倒地,从来没有受够——再次引导华兹华斯的人——亲自尝过断头台。幸运的是科学的未来,特别是像素,罗伯斯庇尔的脑袋拯救了傅里叶的脑袋。7
1789 年的那篇代数论文——将革命从傅立叶的脑海中推开的那篇论文——是这位伟大科学家的第一次公开瞥见吗?它是否包含他伟大想法的关键?正如数学家所说,这无疑提高了他的数学技能并提高了他的“数学成熟度”。但我们不知道里面有什么。
我们不知道,特别是傅立叶何时开始使用波,这是他伟大创意中的基本形状。但到了 1807 年,他已经公开了它。这是你通过展开一个完美的圆圈得到的形状,所以它是一种革命性的形式。它非常简单。像素具有崇高的传统。
要获得傅立叶波的图像,请从一个圆圈开始(图 1.1)。老式的模拟钟面可以达到目的。秒针的尖端围绕着那个圆圈稳定地移动,从一个分钟标记到下一个标记,一秒一秒。下图显示了三秒后的上表盘。
较大的红点描绘了波浪。动画电影在这里会特别有启发性,但如果没有这一点,请将时间的流逝想象为向右移动,如时间箭头所示。时钟边缘的每个刻度线都有一个沿着箭头的刻度线。想象一下,红点总是被一条拉紧的水平带拴在秒针的尖端。随着时间的推移,该带向右延长,那个红点所描绘的路径就是波。
这里的重点是,简单地说,波浪看起来像什么,直观地说,它与圆密切相关。这种亲密关系的细节不如直觉重要,但更多的细节可能有助于更难忘地记录直觉。
考虑时钟的中心线——连接 9 点钟和 3 点钟的线。红点始终标记秒针尖端在该中心线上方或下方的当前高度。在为上图选择的(纯粹是任意的)时刻,自记录的第一个位置以来,红点已经追踪了 23 个位置,因为从那时起已经过去了 23 秒。在下一个滴答声中,红点将向右移动到波浪上的下一个点。之后再打两个刻度,得到下图。因此,当秒针在时钟上一次又一次地滴答作响时,它的尖端——实际上是附着在尖端的红点——描绘出所示的波浪形路径,上下,上下。. .
图 1.1
秒针每分钟转一圈,所以红点所描绘的波浪永远向右移动。它也永远向左延伸。图中的波浪似乎在中午后一分钟开始——另一个纯粹的任意选择——但显然时钟一直在滴答作响,直到你可能想追踪的时间。
图中的波是傅里叶波之一。他没有发明它们,但他深刻地利用了它们。这些是他音乐的组成部分。数学家将这种特别可爱的圆形波称为正弦波。由于这是我们需要的唯一一种 wave,我通常将其简称为wave。
关于傅立叶波的一切都是简单、美丽、优美、完美的。科学家和工程师对傅立叶的热流解以及他伟大的音乐理念有一个正式的术语。他们将其描述为谐波。
那个波浪形无处不在,并且一直伴随着你。从您家中或办公室的任何插座流出的电流电压都是波。由于其波动性,它被称为交流电,AC。它通常源于转子的转动,例如大坝后面的水。转子的圆圈展开成交流电或波电流。电机使转子向右转动。波形电流进入电机并将能量卷回圆形机械运动。电风扇吸进一波,又放出一个圆圈。
另一个熟悉的正弦波来自媒体世界。这是您最喜欢的 FM 广播电台的电话号码。我在旧金山地区的 KCSM 爵士乐是 91.1。数字 91.1 正式指定了当局分配给 KCSM 的波,仅用于广播。它描述了电台用来将音乐传递给听众的电磁波。
尽管所有的傅立叶波都具有相同的形状,但它们在两个方面有所不同——它们摆动的速度(称为频率)和波峰的高度(振幅)。在时钟图中,秒针波峰的频率是多少?它每分钟出现一次波峰,这就是它的自然频率——每分钟一个完整的波周期。循环是完全正确的词。当秒针绕钟面转一圈时,附在其尖端的红点会及时描绘出它的一个完整周期。绕圆周一圈产生一个波周期。
时钟的分针尖端勾勒出一模一样的平滑曲线,但速度更慢。分针每小时只有一次波峰。它的频率是每小时一个周期,比秒针慢六十倍。第三个是时针波。它具有三者中最低的频率,每半天一个周期。
您在 KCSM 的电话号码中也遇到过频率;91.1 是该无线电台使用的波的频率(以每秒数百万个周期为单位)。那些无处不在的交流电源插座每个都以每秒 60 个周期的频率发出波(在美国)。
秒针、分针和时针波的幅度和频率各不相同。我把分针画得比秒针略短,所以分针的波峰略低。由于波峰的最大高度是其振幅,因此分针波的振幅低于秒针波的振幅。时针更短,所以时针波的振幅是三者中最低的。
对于傅立叶的目的,波可以有任何频率和任何幅度,只要它是一个正弦波——一个展开的圆。时钟图(图 1.1)产生了三个这样的波,图 1.2 显示了另外三个,它们都具有优美的形状,并且仅在摆动速度和高度(频率和幅度)方面彼此不同。他们都有形状相同,意思是所有三角形都具有相同的形状。三角形只要有三个直边就可以成为三角形,而波浪只要是展开的圆形就可以成为波浪。
图 1.2
注意这张图片中波浪的另一件事:它们周期中的不同点与图片的左边缘对齐。顶部波的波峰与边缘对齐,中间的波谷,以及底部波之间的某个位置。如果你向左或向右滑动任何波,它的频率和幅度不会改变,但它相对于另一个波的位置会改变。这很重要,因为傅立叶让我们将波加在一起。如果波的排列方式不同,您会得到不同的总和。
我们使用阶段这个词来描述波浪的位置。著名的月相告诉我们月亮在其周期中的位置。它是满月或新月,或者是在满月和新月之间的盈亏。波是循环的,所以它也有一个相位。在图 1.2 中,顶部的波浪在图片的左边缘处于波峰(满月),而中间的波在该处处于低谷(新月)。底部的刚刚开始从它的顶峰减弱到它的谷底。改变波的相位会使整个波向左或向右移动。但请注意,如果您将其移动一个完整的周期,则该波正是原始波。没有办法区分它们。因此,在单个周期中指定一个位置(即相位是什么)就足以指定整个波的位置。对于傅立叶的目的,波可以处于任何相位。
傅立叶的伟大想法现在可以一瞥:世界的大量模式——包括我们能看到或听到的一切,还有很多很多——可以准确地描述为这种类型的波的总和,仅此而已. 傅立叶频率是这种描述中波的频率。他们的和谐是世界的音乐。这个想法是如此之大且违反直觉,以至于可能难以理解。所以让我们从音乐本身开始,这是一种熟悉的物理现实,有助于直观地理解傅立叶的深刻思想。
音乐是由——而且只是——不同频率的波组成,当然也称为声波。小提琴上的琴弦以不同的频率振动,钢琴也是如此。与时钟每分钟一个周期的秒针频率相比,钢琴的中间 C 是来自以每秒 262 个周期振动的弦的声波的速度恶魔。单簧管或长笛以特定频率共振,管风琴的每个管子也是如此。抒情的花腔女高音歌唱的频率比中音高,也比男中音或低音高得多。我们说女高音唱得更高而不是频率,指的是我们大脑对音乐的感知,而不是音乐创作的物理原理,但它等同于同一件事。正如我们所说,一个和弦本质上是几个波——比如三个或四个——同时演奏,或者加在一起。合唱团由许多不同音高的声音组成,管弦乐队由许多不同频率的乐器组成,从弦乐贝司到短笛。
音乐的动态,从弱音到强音,反映了音乐中波的幅度。振幅越大,声音越大。巨大的双调音管风琴管——脚踏板最大限度地放在地板上——用全能者的可怕力量震撼着一座大教堂。用力敲击钢琴键或调高收音机的音量以增加波的幅度。毫无疑问,收音机或立体声系统的主要部件是其放大器。
当您描述音乐时,傅立叶的想法似乎很自然,但当您考虑到所有声音(不仅仅是音乐)都是由音频波组成时,他的想法的力量就会开始显现出来。我们谈论低频隆隆声和高音哨声。众所周知,狗能听到比我们更高的音调。我们对傅立叶大思想最本能的直觉是,任何声音或音乐都是由不同频率的声波组成的,它们全部叠加在一起,被我们的耳朵和大脑解读为斯特拉文斯基仪式、心爱的孩子的声音,甚至是建筑工地的噪音。
图 1.3 以不同频率和幅度的傅里叶波形式显示了单词yes(时间向右)。左边的“y”部分包含最低频率和最高振幅——它是单词的重音部分。中间的“e”部分具有最低幅度和混合频率。右边的“s”部分具有较低的幅度和最高的频率——“s”的嘶嘶声。
声波实际上是由——它们的“材料”是——空气的有节奏的压缩,或压力波。考虑一下扬声器系统中的低音扬声器——在响亮的低音音调下您实际上可以感觉到振动的大低音扬声器。很容易想象低音喇叭的快速移动膜在它面前晃动着空气。这种脉动的空气从低音扬声器的表面移动——可以说是被它推动的。更大的声音会在每个更大的振动中引起更高的空气压缩。
图 1.3
我们直接了解这些压力波。想想一个低速骑手在洛杉矶的克伦肖大道上慢慢地驼背,巨大的音箱摇晃着附近的窗玻璃。
一个非常响亮和低沉的声波将这些高压波转换为物理振动,似乎是地球本身的振动。但实际上,那些惊天动地的波浪,与进入我们耳朵,使我们的耳膜随着低音喇叭、音箱或双深管风琴一起振动的波浪完全一样。然后一个聪明的小骨头系统——令人愉快的名字是锤子、铁砧和马镫——将这些振动传递到内耳,在那里成千上万的微小毛细胞对不同的频率做出反应。它们将频率信息直接传递到大脑。
正常的年轻人耳可以听到每秒 20 次循环到每秒 2 万次循环之间的所有频率。现代用法将“每秒周期数”缩短为“赫兹”(缩写为 Hz),但我会坚持使用较长的短语以保持其直观性。还有人耳无法听到的其他声音,比如狗能听到但我们听不到的超声波哨子。
图 1.4
但是视觉中的波是什么——导致像素的波?视觉振动的频率是多少?
傅立叶出生仅一年多后,Nabolione Buonaparte 就出生在科西嘉岛,科西嘉岛与巴黎和欧塞尔接壤,但位于法国大陆东南约一百英里处(图 1.4)。科西嘉岛在这两个男孩出生的间隙已经成为法国人,所以波拿巴只是勉强是法国人。他的名字在他 20 多岁时才流行起来,当时他将其归结为拿破仑·波拿巴。8
波拿巴参加了布赖耶纳城堡的皇家军事学院。这与傅立叶就读的学校系统相同,他在大约 60 英里外的欧塞尔就读。因此,波拿巴接受了与傅立叶基本相同的科学和数学训练。这足以让波拿巴对数学产生持久的兴趣。他他一生都与数学家互动,而不仅仅是傅立叶。甚至还有一个几何定理,拿破仑定理,以他的名字命名。
波拿巴在巴黎的精英军事学院继续深造,深入军事机构。他在那里的训练细节与我们无关,但他的期末考试却很重要。他的考官形容波拿巴“对数学有透彻的了解”。他是皮埃尔-西蒙·拉普拉斯,有时被称为法国的艾萨克·牛顿。
波拿巴后来让拉普拉斯成为法国参议院议员,此举令当代美国人感到难以置信。一位著名的数学家和物理学家担任参议员!
罗伯斯庇尔倒台后,革命的法国政府不仅将傅立叶从监狱中释放出来,还授予他在新成立的巴黎综合理工学院(现为法国麻省理工学院和加州理工学院合并)的教授职位。最后,他在巴黎自称数学,并遇到了它的领军人物,比如拉普拉斯。这使他很好地吸引了雄心勃勃的波拿巴的注意,他正在寻找“专家”陪伴他去埃及旅行。并在身体上和政治上获得更多热量。
波拿巴最近在与奥地利人的战斗中征服了意大利,并以英雄的身份回到了巴黎。有了这样的赞誉和一支军队,法国政府正确地将他视为威胁。看到他(更不用说他的军队)于 1798 年启程前往埃及并进行新的征服,他们并没有不高兴。这次离开最终使傅立叶和波拿巴走到了一起。
为了效仿他的英雄亚历山大大帝,波拿巴率领一队法国知识分子(他的学者)参加了入侵,其中包括来自巴黎综合理工学院的年轻教授傅立叶。同样,与我们时代的对比是惊人的。想象一下,在第一架飞往伊拉克或阿富汗的飞机上,一支由领先的数学家和考古学家组成的团队。
埃及探险队在军事上失败了,但在智力上却取得了飞速的成功。罗塞塔石碑的发现是一个著名的高点。埃及学就是从这些开始的。波拿巴本人在那里创立了埃及研究所并担任副校长。傅立叶很快就成为了它的常任秘书。在接下来的十年左右的时间里,他为埃及运动的持久学术声誉做出了贡献,他撰写了大量(20 多卷) 《埃及描述》的导言——对波拿巴过度赞扬。波拿巴甚至在这里和那里进行了一些编辑,以试图从军事失败中夺取知识分子的胜利。
法国在亚历山大港、开罗和大金字塔取得了几次初步胜利后,纳尔逊海军上将和英国人在埃及港口摧毁了法国舰队。尽管英国控制了地中海,但波拿巴在埃及呆了一年多一点后,还是设法偷偷穿过它到达了法国,几乎把其他所有人——以及许多未完成的军事任务——都抛在了后面。
他的动机是尝试控制法国——他当然做到了。就在 18 世纪末,他成为了新政府的第一任执政官——这是他成为皇帝的第一步。
当他的学者试图跟随他回家时,他们就没那么幸运了。英国人允许他们通过海上封锁,但保留了罗塞塔石碑。它仍然是大英博物馆中参观人数众多的珍品。
波拿巴仓促而投机取巧地离开埃及,让让·巴蒂斯特·克莱伯 (Jean Baptiste Kléber) 陷入了军事混乱。波拿巴任命他为埃及军队的将军,并通过邮件将此事告知他,因此他无法拒绝。波拿巴用这个伎俩赢得了克莱贝尔的蔑视,后者被留下来收拾残局。
现在傅立叶犯了他的第二个重大政治错误。他变得与这位不幸的将军过于亲近了。Kléber 任命他为埃及的分局局长。然后,当一名学生在开罗暗杀克莱伯时,傅立叶为这位将军发表了悼词。那个有天赋但很麻烦的舌头再次摇摆不定:首先他得罪了罗伯斯庇尔,现在得罪了波拿巴。
波拿巴显然不希望傅立叶在首都提出克莱伯的观点。他不想让法国知道他在埃及战役中不那么高尚的军事细节。傅立叶曾希望,在埃及之后,他可以在巴黎恢复他的声望地位,成为知识分子行动的中心。相反,波拿巴将直言不讳的傅立叶流放到格勒诺布尔。
但在这样做时,他委婉地选择了他的话,“要求”傅立叶担任伊泽尔省的省长,该省由格勒诺布尔管辖。换句话说,波拿巴“要求”他成为一个比巴黎更靠近科西嘉的省的省长(省长)——距离行动还有很长的路要走。
傅立叶接受了。波拿巴现在是法国最有权势的人。然而,这是流放,这就是傅立叶的看法。在埃及之后的十年里,他是法国唯一一位不在巴黎的领先数学家和物理学家。
您可能很乐意将您听到的内容视为波的总和,但您不会以这种方式思考您看到的内容。那么,下一步将需要一些时间更多解释。傅立叶的伟大想法是视觉世界,就像音乐一样,是由波的总和构成的。但就视觉而言,波是空间波。它们是二维的。看到它们需要一点练习,但是一旦你养成了寻找它们的习惯,这一点也不难。我们会习惯于看到它们,然后实现傅里叶所做的飞跃。
时钟图中的二手波(图 1.1)实际上描绘了一种空间波。它代表了一个沿着时间箭头前进的时间波,但我实际上画的是一个左右延伸的空间波。傅立叶的伟大思想涵盖了空间和时间。波的种类取决于物理过程。如果它通过时间传播,如声音、光或二手波,那么这些波就是时间波,频率就是每秒的周期数。图片_二手波的频率是空间波,它的频率以每英寸的周期数表示,如图所示,大约每 3 英寸一个周期。如果我要以相同的比例绘制分针波,它的频率将减少 60 倍,或大约每 180 英寸一个周期。时针空间波大约每 2,160 英寸有一个周期,比分针波少十二倍。
我称之为视觉波的波不要与光波混淆。光波是一种激发我们眼睛的视杆和视锥细胞的机制,以便我们可以看到。它是一种以极高频率随时间变化的波,例如每秒 500 万亿个周期。所以光波是观看的手段,但视觉波是我们所看到的。光波随时间变化,视觉波随空间变化。
视觉空间波的证据无处不在。看看你正在阅读的页面。字母,包括作为字符的空格,似乎或多或少均匀地放置在页面的水平尺寸上。在frequencyspeak中,它们在页面上以或多或少的恒定频率出现,并且文本行在页面下方以绝对恒定的频率出现。您可以将文本视为波峰,将线条之间的空间视为某种“波浪”的波谷。书架上的书籍在水平方向上以相当恒定的速度重复。货架本身以相当可预测的频率垂直重复。这些都不是傅里叶的美丽平滑波,但它们都暗示了视野中空间波的概念。
事实上,如果你能在你的视觉世界中感知到某个频率的“波”,那么傅里叶版本的它就会以那个频率的波为特征。我刚刚测量了我正在阅读的书中一行文本的底部与下一行底部之间的距离为四分之一英寸。所以那个页面的音乐版本,如果你想它是一张图片,一定有一个频率相同的傅立叶空间波,每英寸四个周期。
屋顶梁以恒定的节拍“涟漪”穿过天花板,硬木地板的木板在一维中以熟悉的频率重复。瓷砖地板有重复的瓷砖在两个维度的平铺频率上,平铺屋顶也是如此。Alhambra(图 1.5)将瓷砖——地板、墙壁、天花板——带到了令人惊叹的愉悦高度。
图 1.5
妙语是,您可以仅用傅立叶波来表示所有这些空间节奏。所有视觉图案,无论多么明显不规则,都可以描述为傅立叶美丽规则波的组合、总和。
但是自然界呢?那里也是如此,尽管不太明显——除了海浪。草坪或草地上的草叶以特征频率重复。树的叶子也是如此,尽管叶子之间的粗略间距取决于树的种类。森林中树木的间距具有特征频率,也取决于物种。山脉以某种频率达到顶峰。大自然母亲的频率远不如我们的那么均匀。她的重复模式更具随机性。然而,山峰不会出现在例如每英寸两个山峰或每百万英里两个山峰处。有一个频率范围,这或多或少是我们对山脉的期望,更像是每十英里有两个山峰。再一次,所有这些视觉节奏都符合傅立叶的节奏。
图 1.6 的目的是向您展示如何在世界上寻找空间频率——作为查看它的另一种方式。这是我多肉花园的照片加利福尼亚州伯克利。到处都有空间频率。一旦你开始在这里或任何地方看到它们,那么实现傅立叶所做出的飞跃并不难——波和它们的各种频率是你完全描述视觉场景所需要的。
图 1.6
考虑一下陶罐,这是这个场景的一些人造成分。观察它们在松散的网格上的情况。它们的间距不规则,但它们确实有一个松散规则的重复模式——比如每隔一英寸左右就有一个锅。在这部分图片的傅里叶等效项中,有一组与底池放置频率略有偏离的波浪,以解释与严格规律性的轻微偏离。
花盆上的图案也很规则。只考虑一条穿过图片的线,比如一条与罐子对齐的线,由下方的一对箭头表示,线 a。换句话说,一次只将注意力集中在一条线上的规则频率上——就好像沿着那条线的光强度是一段音乐中的声音幅度一样。你能想象你花园的光强度会说“是”吗?
从a线上的左边开始,详细地,那里是锅上螺旋凹槽的中频,然后是锅之间的高频(但幅度很小)污垢,然后是第二个锅上的凹槽的中频,然后是定义最大电位器曲线的波的低频,然后是其他两个电位器的两个稍高的频率,依此类推。
植物也有频率。不同的仙人掌和多肉植物具有不同的分枝或叶子放置频率。要看到这一点,请将您的注意力集中在沿线 b 的位置处几乎规则的频率上。这条线穿过(图像)两个星爆状结构的仙人掌。沿着这条线,每个物种的“叶子”以几乎规律的频率出现。(仙人掌的刺实际上是它的叶子。“叶子”是它的树枝。)
下一条线,c 线,与绣球花的大球相交,每个球由数百个小花组成。小花以比任何其他尚未讨论的植物更高的频率与线相交。下一行(d 行)与绣球花的叶子相交。它们沿着这条线出现的频率低于小花沿着c线出现的频率。也就是说,同一个空间里大约有两个叶宽,相当于有几十个小花宽。小花比叶子更密集,或者,在频率峰值中,它们以更高的空间频率出现。
穿过图片的四行显示为彼此平行,但傅立叶并不要求这样做。您可以通过在图片中以其他角度(甚至垂直于所示角度)寻找重复的图案来锻炼您的直觉。例如,您可能会看到大扁平椭圆上的凸起的规则结构照片中央附近的仙人掌仙人掌的“叶子”。那些颠簸是它的刺所在的地方。您可以通过二维中的凸块绘制两个或多或少相互垂直的波。这或多或少是二维傅里叶思想的作用。
回到人造部分:砖天井在宽度和宽度上有重复频率。背景中的栅栏(很难看到)有它的板重复频率,在它上面编织的格子也是如此。
我们可以继续对照片的每个部分进行这种分析。由于粗糙,穿过树皮的线会产生具有高频细节的波。盆中的豌豆砾石以非常高的空间频率出现。等等。花园是空间音乐的交响曲。
傅立叶的遗产是我们所看到的一切——呈现给我们视网膜的视觉世界,无论它是否看起来有重复的模式——都是空间音乐的交响乐。它可以用所有频率和幅度的二维空间波来表示。都是音乐。它就像音乐一样工作,但对我们的眼睛来说是二维的,而不是对我们的耳朵来说的。我们需要这种关于可见世界波动性质的直觉,以便在下一章解释像素。
让-弗朗索瓦·商博良是格勒诺布尔的公民,而傅立叶则应波拿巴的“要求”在那里担任省长。傅立叶向年轻的商博良介绍了罗塞塔石碑(图 1.7)以及占据其前三分之一的古埃及象形文字的奥秘。在接下来的二十年里,商博良使用石头底部三分之一处的古希腊对应物作为重要来源,破译了象形文字。
傅立叶与第一领事的特殊关系使这成为可能。商博良多次被征召入伍,但每次傅立叶都成功地直接向当时的首席埃及亲信者波拿巴提出了豁免这个年轻人的请求。如此自由地追求他的激情,商博良破解了罗塞塔石碑的密码并建立了埃及学领域。9
傅立叶的伟大想法——世界就是音乐,一切都是波——是科学的罗塞塔石碑,而傅立叶是它的商博良。今天,所有同类的科学家、工程师和技术人员都在使用傅里叶频率语言。它是声音、图像、视频等等的通用语言——包括许多最常见的物理过程,尤其是媒体技术。傅立叶展示了如何在他的频率语言和普通语言之间来回翻译,比如跨越空间的颜色或跨越时间的声音振幅。
图 1.7
照片由克劳迪奥·迪维齐亚拍摄。
您可能在随意的谈话中听到有人说“我没有足够的带宽”。如果您是技术人员,您将立即知道这意味着什么。如果你不是,你可能已经推断出它的意思是“容量”,但你不知道为什么。这是一个傅立叶频率词,这就是原因。
从技术上讲,带宽是衡量通信信道容量的指标。例如,年轻的人耳可以听到每秒 20,000 次循环到每秒 20 次循环的声音。所以它的带宽是两者之差,即对耳朵有意义的频带宽度。在随意的演讲中,带宽被用来比喻你处理信息的能力。
像这样的频率说话是两种文化的分隔符之一。它对艺术来说是希腊语,所以通过罗塞塔石碑的比喻,频率说话(傅立叶的波浪语言)必须是象形文字。现在让我们看看傅立叶的象形文字——他的二维形式的波——如何代表图片。
究竟什么是二维波?到目前为止,我们只看到了一维波,比如用于声音的波。傅立叶应用于视觉世界的想法需要他的波的二维版本。
一维波是一个展开的圆。二维波是一个展开的圆柱体。要在二维中可视化波浪,请想象时钟的二手波浪垂直于页面挤出。你得到的是一个波纹状的表面,就像一个有沟的田野。波纹金属建筑由二维空间波片组成。一些门廊屋顶由波纹塑料板制成(图 1.8)。某些褶边薯片是波纹状的。我们称之为瓦楞纸板的平面之间的波浪层是另一种空间波。地中海风格的红瓦屋顶是另一个。
因此,波纹是二维空间波。查看它的边缘(横截面)以查看一维波。事实上,它的任何直截面也是一维波。
傅立叶的大思想是,所有的视觉世界都可以表示为所有频率和幅度的波纹空间波的总和。为了处理第二维,唯一增加的扭曲是波可以旋转到任何方向。犁沟可以向南北向,或东向西,或东北向西南,或以任何其他角度延伸,这对自然界尤其重要。空间波的“材料”可能是镀锌铁,或者,正如图中所示,塑料。工程师们使用傅立叶的想法来描述现实和人造世界中的所有复杂模式——由世界构成的所有材料构成。
图 1.8
但是要理解像素,我们需要考虑某人看待那个世界的观点。世界可能是由铁、塑料和土豆构成的,但我们看到的是一种色彩亮度的图案——一个由明暗色调和形状组成的领域。我们所看到的世界的傅里叶波的东西是光的强度,因为它在视野中变化。
我们怎么能想象这样一个领域呢?解释呈现给眼睛的世界的一种明显方法是描述视野中每个点的光强度。但这意味着视野中的每个点。视野是一个连续的东西——每一个可能的点都被光着色。这些点之间没有中断。无论我们选择的两个点有多接近,中间总会有另一个点。有无数个点,需要指定很多点。
傅里叶为我们提供了另一种方式:将视觉世界视为空间波的总和,这些空间波加起来与逐点描述相同。例如,图 1.9 顶行中的图片可以通过给出每个点的灰度值以显而易见的方式描述,或者可以通过仅指定一个波等效地描述为傅里叶方式。“加起来”到这张图片中的一个空间波的频率约为每英寸两个周期,其亮度水平在明暗之间摆动。只有少数几个值指定了整个图片——一个频率和一个最大幅度——而不是大量的灰度,一个对应图片中的每个点。
图 1.9
顺便说一句,最上面的图片显示了从上面看到的傅里叶波纹之一(部分)。因此,毫不奇怪,那个波浪就是这张图像的完整描述。请注意,您可以看到构成视野的波的振动,就像您可以听到构成声音的波的振动一样。该图中波的“成分”是光强度(或亮度)——被认为是灰色阴影。波浪的高部分是浅灰色,低部分是较暗的。(该图是图 1.2 中波浪线的二维对应物。)
幅度对应于视觉场景的亮度,就像它对应于声音的响度一样。频率对应于场景中细节的数量,人们在谈论高分辨率图片或高清视频时所指的那种东西。高振幅意味着明亮,高频意味着细节。
当颜色可用时,颜色信息也在那里。我们的眼睛有三种颜色感受器——视锥细胞——红、绿、蓝光强度各有一种。如果一个手机或电视屏幕上的点会显示红、绿、蓝光强度,然后我们的大脑会从我们的视锥细胞中接收这三种信号的相对强度,并从中感知颜色。来自电子显示器的发射光混合颜色的方式与来自油画(比方说)或彩色墨水印刷页面的反射光不同。为了使发射的光呈现黄色,我们必须打开红色和绿色部分并关闭蓝色部分。但是,为了让白色页面反射的光呈现黄色,我们必须阻挡白光的蓝色部分,只让红色和绿色通过。无论采用何种显示技术,在视觉上都是一样的。我几乎总是使用发射(非反射)光术语。
因此,将图 1.9 顶行中的灰度波想象成一种颜色波——比如说黄色波。所显示的波峰是介于中灰和全白之间的灰色,而我们的彩色波峰是介于中黄和全黄之间的黄色。您可以将彩色波想象成三个频率相同但幅度不同的波,每个用于我们的红色、绿色和蓝色受体。所以我们的黄色波由三个波组成,一个类似于上面显示的红色受体的灰度波,另一个与绿色受体类似(相同幅度),第三个与蓝色受体类似但幅度为零。红色和绿色相等,没有蓝色,我们的大脑看到黄色波。
图 1.9 中下两行的图片显示了额外的二维波浪,以使您熟悉它们的外观。就像一维的情况一样,三个波处于三个不同的频率和三个不同的幅度。对于所示的波,最高频率波(底行)具有最低振幅(中灰色),而最低频率波(顶行)具有最高振幅(接近白色)。但事实并非如此。波可以具有任何幅度的任何频率。
这是从这些数字中得出的直觉:图片中的精细细节必须来自其傅里叶描述中的高频波。它们是唯一变化得足够快的波浪。计算机图形学高手会说诸如“那个场景中有很多高频”之类的东西,这意味着——当然没有解释——它有很多微小的细节和锐利的边缘。
后面关于边缘的评论指的是你应该知道的一个方便的事实。这当然不直观。这是傅里叶数学的直接结果:在锐边的突然转变需要傅里叶世界中非常高的频率;一个非常突然的变化需要非常高的频率。
这是我对傅里叶妙语的再次表述:
任何视野——让我们称之为图片或图案——都是优雅起伏的波浪的总和,并且只是这些波浪的总和,所有这些都是完美圆柱体的展开。
作为波浪的视觉世界并不比声音更神秘——或者我们可以说它同样非常神秘。葛底斯堡演说可以用林肯演讲时每一刻的声压强度来描述,也可以用不同频率和振幅的声波叠加在一起来描述。傅立叶告诉我们两种描述是等价的。
科学家和工程师喜欢傅立叶的版本,因为通过使用非显而易见的频率描述,他们可以解决现实世界中无法通过明显的、等效的逐点描述解决的问题。
我们不是在谈论一千个光点,而是在频率上谈论叠加到这些点的光强度波的频率和幅度。傅立叶的变革性教导是这两种描述是等价的。逐点视野是希腊文。傅立叶波音乐等价物是象形文字。对于极客来说,象形文字比希腊文更容易阅读。罗塞塔石碑是傅立叶证明两者相同的证据。
傅立叶的批评者不相信他是对的,但数学表明这是对的。这就是这个想法的魔力——以及数学令人敬畏的、打破直觉的力量。把不同频率的波加起来真的会给你一张图片。. . 任何事物!例如,关于我多汁的花园,或者你正在阅读的页面,或者你的孩子。这是傅立叶伟大而宏大的想法。
傅立叶在恐怖袭击中幸存下来,他甚至在法国统治——如果只是作为省长——多亏了波拿巴。但是,当国王重新掌权时,无论是他早期的反贵族立场还是他与皇帝的关系,都不是方便的凭据——两次。尽管如此,傅立叶还是在这场摄政和帝国之舞中的幸存者,就像他在恐怖中一样。他以相当高的政治技巧成功地在伊泽尔省担任了近十三年的省长,只有最后一年是冒险的。
在 1802 年 4 月至 1814 年 4 月的 12 年中,傅立叶作为一名出色的格勒诺布尔总督充分利用了他的流放生涯。他与40个公社谈判达成了一项协议,以排干伊泽尔 (Isère) 布尔干 (Bourgoin) 的大沼泽地,这是一场巨大的政变,因为之前的所有谈判尝试都失败了。他穿过一条从格勒诺布尔到都灵的新路。他为图书馆购买书籍,支持他所在部门的年轻人——最著名的是商博良——并参与了《埃及的描述》 ,最终于 1810 年出版。在此期间,傅立叶以某种方式找到了发展他的波动理论的时间。他不是通过听莫扎特或观察阿尔罕布拉宫到达那里的,而是通过考虑热量波的条款。也许他的théorie de la chaleur(他的热理论)——以及他伟大的和谐思想——是他重新进入巴黎的总体计划。
傅立叶本人谈到他对热的非凡兴趣时说:“在我看来,地球温度问题一直是宇宙学研究的最重要对象之一,而我在建立热的数学理论时主要考虑了这个主题。” 他正在寻找一个和牛顿一样大的想法。
Victor Cousin 是一个认识傅立叶的人,他对他的动机有不同的看法。他写道,当傅立叶从埃及回到格勒诺布尔时,即使在最热的天气里,他也从不出门,没有一件大衣和另一件备用。他已经产生了对热量的身体需求,这听起来充其量是古怪的,但这相当于一种疾病。
法国人对他有一个我们在英语中缺乏的词:傅立叶是frileux。他感到非常寒冷。他对寒冷非常敏感,也许很痛苦。这个词还带有他无法个人温暖的内涵。人们可能认为傅立叶的冷酷程度不止一种。
没有人知道傅立叶是什么时候开始研究热力的,但他在格勒诺布尔时就全神贯注于这个理论,就在埃及之后几年。可能在 1804 年或 1805 年完成的有缺陷的草稿版本包含他的波浪的第一次已知外观。他在 1807 年末的一本名为“固体中的热传播理论”的“回忆录”中向学术公众展示了该手稿的一个大大改进的版本,现在被认为是确立他的想法的论文。在编写这两个版本之间的时间里,他已经熟悉了热的实际物理学,并进行了实验来测试和验证他的数学结果。
用傅立叶的话说,整个过程“有助于赋予该理论一种权威,在一个仍然晦涩难懂且显然存在许多不确定性的问题上,人们可能倾向于拒绝这种权威。” 这就是经典科学。使用理论进行假设。用实验来验证。这证明傅里叶既是数学家又是实验物理学家。他不怕弄脏自己的手。
傅立叶意识到他可以将流经固体物体的复杂热量模式描述为他的波的总和。这意味着他可以预测热量将如何(以及多长时间)从大炮的接触点流到嘴巴。
因此,从长远来看,在 1803 年至 1807 年期间,他在完善热理论和进行支持性实验的同时,也在谈判沼泽排水合同、修路、指导部门中的年轻人,并为埃及出版物工作. 傅里叶从哪里获得带宽?
傅立叶驾驭了帝国和革命的政治。他利用自己对拿破仑(皇帝被称为波拿巴的称呼)的个人知识,根据一页纸的提案获得了大型公路项目的批准,拿破仑在两天内就批准了。但傅立叶在学术界更加激烈的政治中度过了一段艰难的时光,也许是因为流亡中的傅立叶与巴黎喧嚣的学术活动疏远了。
在 1807 年“回忆录”的科学院官方读者中,有拉普拉斯,他是拿破仑的参议员任命者,他从傅立叶在巴黎综合理工学院的时候就认识了他。拉普拉斯对傅立叶伟大想法的数学运算感到不舒服。对它的第一次公开攻击来自拉普拉斯的门徒西蒙·丹尼斯·泊松,当傅立叶成为伊泽尔省长时,他在巴黎综合理工学院担任傅立叶的主席。长期而激烈的争论的结果是,这本回忆录从未出版过。最终,拉普拉斯开始支持傅立叶,但傅立叶的死敌泊松从来没有这样做过。
在后人看来,傅立叶在他 1807 年的回忆录中确立了这一理论——使 2007 年成为这个想法不为人知的 200 周年——但在它被真正接受之前,他必须经历另一个挑战。可能是因为长期的争论,学院宣布将在 1811 年颁发数学大奖,主题是 . . . 热在固体中的传播。厚脸皮!傅立叶以他的论文奖作为回应,这是 1807 年论文的扩展版本,保留了早期回忆录的主要贡献。10
因此,让我们总结一下傅立叶在准备获奖论文时所做的事情:沼泽。道路。指导。描述 de l'Egypte。同样,他从哪里获得带宽?
1807 年回忆录之外的获奖论文的延伸之一讲述了傅立叶的牛顿野心。他将他的热流理论应用于一个球体——一个行星大小的球体——因此是第一个研究现在被称为温室效应的陆地现象的人。穿过地球大气层的阳光加热地球表面,而大气层在附近保存了一些热量。这是一个不完美的比喻,但大气就像温室的玻璃,它可以让阳光进入,但不会让所有的热量散发出去。自然温室效应的热量使地球变暖,并使其成为我们所知的生命之地。尽管傅立叶才华横溢,但他无法预见目前威胁地球生命的非自然温室效应热量。11
尽管有学院派的恶作剧,傅立叶还是凭借他的论文奖获得了奖项。但同样,他没有得到阅读它的学院委员会的全力支持。特别是,拉普拉斯投了反对票。
“作者得出这些方程式的方式并非没有困难,”委员会在其报告中说。“他整合它们的分析在一般性甚至严谨性方面仍有待改进。”
数学上缺乏严谨性是最大的侮辱。学院在出版有奖论文方面拖了后腿,就像它为回忆录所做的那样。12
直到 1815 年拿破仑最后一次流放至圣赫勒拿,傅立叶返回巴黎后,他才成功发表了他的获奖论文。它仍然受到无情的泊松的猛烈抨击。但是傅立叶在泊松的著作中发现了一个基本错误,并且在他的竞争热理论中发现了一个错误的主张。傅立叶在给拉普拉斯的一封信中摧毁了两者。这是他的对手的致命一击,最终拉普拉斯站在了他的一边。
胜利的科学进步并没有与光荣的政治成功相匹敌。傅立叶继续与拿破仑共舞,这让他作为伊泽尔省长的第十三年也是最后一年感到不安。拿破仑于 1814 年 4 月退位,路易十八恢复为国王。这位前皇帝前往厄尔巴岛进行他的第一次流放,厄尔巴岛位于科西嘉岛以东约 30 英里处,位于巴黎东南部。他在去格勒诺布尔的路上自然会经过格勒诺布尔。在正常情况下,傅立叶也很自然地会向“给他”工作的人打招呼。知府必须迎接前皇帝。但时代几乎不正常。这注定是一次尴尬的相遇。
国王的复辟使傅立叶的地位暂时保持不变,但拿破仑会认为他向摄政的鞠躬是一张变脸吗?傅立叶不打算四处寻找。在幕后,他在拿破仑的旅行路线上绕道绕过格勒诺布尔,理由是对前皇帝的潜在伤害。有效。拿破仑回避了傅立叶,新的王室政府着手确认傅立叶为省长。国王的兄弟,即后来的查理十世,拜访了他,完成了交易。
但这并不是与拿破仑共舞的结束。1815 年 3 月 2 日,傅立叶收到了来自邻近省长的这封可怕的信:
我荣幸地通知您,波拿巴率领 1,700 人昨天在胡安湾登陆。. . [并且] 将由圣瓦利耶、迪涅和格勒诺布尔前往里昂。不管这个消息在你看来多么不同寻常,它都是真实的。13
拿破仑从厄尔巴岛回来了他最后的百日权力,再次取代了国王。他沿着连接厄尔巴岛和科西嘉岛到格勒诺布尔、欧塞尔和巴黎的那条决定性的东南西北走廊返回。傅立叶将不得不再次与拿破仑打交道,而此时他已经设法伪装成忠诚的保皇党人。
他准备了府邸,供归来的皇帝居住。他在那里给他留下了一张漂亮的字条,给予他个人的欢迎。在其中,他清楚地表明了他对国王的新忠诚并解释了他的冲突。但是当拿破仑进入城市的前门时,他正在从格勒诺布尔的后门到里昂。
拿破仑非常不满,解雇了傅立叶。一个篡位者——傅立叶自己对拿破仑的评价——怎么可能解雇任何人?他不仅这样做了,而且傅立叶和格勒诺布尔的市民都认为他有权这样做,这是衡量这个人权力的标准。
顾问们通过向拿破仑展示傅立叶对Déscription de l'Egypte的赞誉“历史导论”来安抚拿破仑。他的怒火冷却下来,他要求见傅立叶。他们在布尔根相遇,傅里叶在那里排干了沼泽。很难理解这个删除的动态:数学家的软肋?老埃及同志?但是拿破仑不仅原谅了傅立叶,还让他成为了里昂的罗纳省长官!
罗讷河谷的任命发生在 1815 年 3 月 12 日,就在宣布拿破仑从厄尔巴岛返回的信之后十天。事情发生得非常快。拿破仑的滑铁卢是 6 月 18 日,路易十八的第二次复辟是 7 月 8 日。
拿破仑的第二次帝制只持续了著名的百日,而傅立叶的第二府更短,大约六十天。拿破仑作为皇帝的最后一项行为是在滑铁卢前两周授予傅立叶退休金,并在两周后生效。当然,这笔养老金从未兑现。因此,当拿破仑最终被流放到圣赫勒拿岛时,傅立叶既没有工作,也没有退休金,而且政治声誉也很差。
但至少他的流放终于结束了。他可以回到巴黎并建立他的热音乐理论。
傅立叶有生命吗?也许不在格勒诺布尔省,但肯定会回到首都?我们可以希望世界音乐概念之父有一部戏剧性的浪漫故事,就像大约十年前本杰明富兰克林与一家著名法国沙龙的寡妇的故事一样。
也许又是那些奇怪的痛苦,但傅里叶没有赫尔维修斯夫人。事实上,可悲的是,似乎根本没有任何浪漫的兴趣。我们对亲密关系的唯一暗示——这肯定是柏拉图式的——是他与著名数学家玛丽-索菲·热尔曼的深厚友谊。她赢得了科学院奖,是第一位获得该奖项的女性,但她没有出席领奖,这让“一大群无疑被渴望看到一种新的精湛技艺的人所吸引”感到失望。但这还不足以让她获得参加会议的邀请。在傅立叶成为常任秘书七年后,她才收到参加学院降神会或会议的长期邀请。傅立叶做到了。
从傅立叶写给玛丽-索菲的信件中,仅存一份。所有的都是正式的,除了一个,可能是在他晚年写的,因为字迹残缺,写给“Ch。S”(Chère Sophie)并签名“Jh”(约瑟夫)。但傅立叶给一位医生写了一封信,为一位身患疾病的亲爱但未透露姓名的朋友寻求他的秘密帮助:
由于最稀有和最美丽的品质,她值得你所有的兴趣。对于温柔地爱着她的我自己,尽管这完全无法预料的事件可能会使我对她的感情化为乌有,但我非常感谢您为她和我所做的一切。14
我们不确定这个女人是谁,但杰曼确实死于乳腺癌。如果她真的是苏菲,他对她的感情会带来什么?15
巴黎科学院最终让傅立叶成为成员(图 1.10)。拿破仑于 1821 年去世后不久,他的理论的完整版本最终以《热分析理论》的形式出版。荣誉开始累积。学院选举他为常任秘书,牛顿皇家学会于 1823 年 11 月任命让·巴蒂斯特·约瑟夫·傅立叶为外国会员。他在 21 岁时非常羡慕牛顿,但在 55 岁时,他终于在他生命的最后十年中踏上了永生之路自己。1826 年,他成为法兰西学院的官方常任理事,1889 年,古斯塔夫·埃菲尔将他的名字命名在这座著名的塔楼上。 16
拿破仑的死也最终使养老金成为可能。起初,国王政府对傅立叶接受拿破仑在最后百日里担任罗讷省的任命并不高兴。在拿破仑流放圣赫勒拿岛后,他第一次尝试从君主制中获得养老金。他的请求被拒绝了。他在 1816 年、1818 年和 1821 年再次尝试,每次都被拒绝。只有在拿破仑死后,他的下一次尝试才成功。
政治斗争已经结束,但与健康有关的斗争还没有结束。他从来没有摆脱某种身体上的瘟疫。作为一个上了年纪的人,他被呼吸问题所困扰,以至于他为自己制造了一个特殊的盒子,可以在他写作或说话时——或睡觉时——让他保持直立!——只有他的头和手臂伸出。呼吸困难可能要追溯到他十几岁时令人窒息的橱柜,或者可能是充血性心力衰竭。
傅立叶于 1830 年死于心脏病,仅比拿破仑晚了几年。他在巴黎著名的 Pére Lachaise 公墓的坟墓以波浪和埃及图案为特色(图 1.11)。他半身像的两侧是一朵百合花,茎很长,是波浪的轴心。每朵百合花的顶部都有一条戴着太阳圆盘的饲养眼镜蛇。如果埃及确实引起了傅立叶对热的痴迷,那么他的纪念碑的象征意义就是庆祝因果关系。
图 1.10
Julien-Léopold Boilly,傅立叶院士,1820 年。
两年后,年轻的格勒诺布洛瓦兹、埃及学的第一位教授让-弗朗索瓦·商博良跟随傅立叶来到拉雪兹神父。他的兄弟雅克-约瑟夫·商博良-菲雅克撰写了最早的傅立叶传记之一。傅立叶的挚友索菲·杰曼(Sophie Germain)——在谈到她时,他几乎不像是弗莱克斯——在他之后不久也被安葬在拉雪兹神父。
日耳曼的最后一幕是为傅立叶的拉雪兹佩尔纪念碑捐款。泊松,他们俩的敌人,一直顽固不化,没有做出贡献。17
傅立叶的烦恼反映在他 1807 年的原创杰作的命运中,这本“回忆录”首先宣布了他的伟大成果。这份手稿消失了 160 多年,终于在国立桥梁和道路学院的图书馆中重新发现。这并不像最初看起来那么奇怪。这所学校是世界上最古老的土木工程学校,比傅立叶还要古老。18
图 1.11
为什么傅立叶的好主意会遇到这样的阻力?正如他的批评者所看到的那样,问题在于:一个高度不规则的模式——比如一首任意的歌曲或绘画——怎么可能等同于高度规则的波的总和?
在数学中,某些东西被证明或未被证明,或者它被证明是不可证明的。傅立叶本人的理论并没有达到这个真理的顶峰,尽管他的直觉非常合理。它落到了年轻的 Peter Gustav Lejeune Dirichlet 来填补剩余的数学空白。他于 1826 年来到巴黎,结识并钦佩傅立叶。在老人的指导下,狄利克雷坚定地确立了这一理论——十分严谨——并于 1829 年发表,也就是傅里叶生命的最后一年。19
尽管如此,一些数学家仍然为傅里叶数学深奥的死水困扰。但工程师不是。在 1960 年代后期,我参加了斯坦福大学 Ron Bracewell 的一门非常有影响力的傅立叶技术基础课程。他特别努力强调傅里叶理论边缘的数学困难,并教导其适用性的严格限制。但他也强调了这些数学细节如何不适用于对现实世界现象的分析。或者更确切地说,他明确表示,现实世界属于狄利克雷等数学家所建立的界限。
数学家必须处理所有可能的模式,而不仅仅是我们在现实世界中实际发现的模式。数学家处理抽象,但工程师处理物理现实——热、光、声音、道路和桥梁以及图像。对于工程师来说,傅立叶的频率和幅度与他们描述的物理世界一样“物理”。如果大自然产生了一种模式,那么傅立叶的伟大想法几乎总是可以用来描述它。20
牛顿和爱因斯坦知道他们在谈论宇宙,他们的崇拜者也是如此。傅立叶没有或无法预见他伟大的音乐理念有多么普遍——当时其他人也没有。我们没有关于通过时间积累的天才或通过分支产生的天才的词。我们通常对天才的概念是终生的——无论是在成就方面还是在认可方面。
然而,两个世纪以来,工程师们已经成功地大量使用了他的谐波理念,让我们感到舒适和享受。所有现代媒体都依赖于它。Digital Light 的像素和故事只是最新的例子之一。
毫无疑问,傅立叶现在已经达到了他应得的位置,无论我们是否选择称其为天才。只剩下跨越两种文化的过道,让他在双方都知道和尊重。
有一个模糊的、未经证实的、未经任何人证实的传说,你仍然可能在营地里听到:这个群岛的某个地方是天堂般的小岛。. . 唯一的工作就是脑力劳动——而且所有这些都是超级超级秘密的。因此,我亲自到了那些天堂岛(在罪犯行话中,它们被称为“sharashkas”)并在他们身上花了一半的刑期。我的生存归功于他们。
——亚历山大·索尔仁尼琴,古拉格群岛1
发明像素并开始数字革命的人是俄罗斯最高苏维埃主席。然而,不是同时,而是同一个人。他的名字是弗拉基米尔·科捷尔尼科夫。2003 年,当他 95 岁时,另一位弗拉基米尔——普京——在克里姆林宫封他为爵士。到那时,他佩戴了苏维埃俄罗斯的大部分功勋勋章,包括两次斯大林奖和六次列宁勋章,并两次获得社会主义劳动英雄称号。他在 1917 年十月革命以及此后定义现代俄罗斯的所有清洗和战争中幸存下来。他几乎没有避开古拉格——索尔仁尼琴曾在其中辛勤劳作的那个岛屿——受到斯大林最血腥心腹之一的强大妻子的保护。他警告美国人不要使用人造卫星,并用数字图像(来自太空的像素)绘制金星图。
Kotelnikov 在美国也获得了荣誉,在 2000 年获得了亚历山大·格雷厄姆·贝尔奖章——恰如其分地发生了大数字融合。然而,他在美国基本上不为人知。他很少因为他最伟大的发现——采样定理——而得到赞誉,这个想法是整个数字媒体世界的核心。这顶皇冠通常属于美国著名工程师和数学家克劳德·香农,尽管香农从未声称过它。
与傅立叶的故事一样,科捷利尼科夫的故事也具有技术突破的三个驱动力:伟大的科学理念、将其变成必要发明的革命和战争的混乱,以及保护科学家和推广他们的技术的暴君。Kotelnikov 的伟大想法——直接导致了像素——与默默无闻的 Kotelnikov 和著名的 Shannon 极其平行的生活故事交织在一起。
图 2.1
想法是这样的:数字可以忠实地代表模拟。离散的、分离的、尖的可以准确地表示光滑的、连接的和弯曲的。断续可以真实地代表未断续。如果现在这不让你感到惊讶,那么我希望很快就会引起你的惊讶,因为看起来我们可以丢弃大量的信息——实际上是无限的——而不会丢失任何东西。这是使数字光(以及数字声音)成为可能的关键思想。这是促成大数字融合以及现代世界的基本真理。
正如波是代表傅立叶频率的形状一样,也有一个形状代表 Kotelnikov 的样本(见图 2.1)。我们很快就会发现它与像素的“形状”密切相关。数学家称其为sinc,而工程师则称其为重构滤波器。因为这两个名字都不直观,所以我把这个可爱的形状称为吊具。你很快就会明白为什么。
请注意,散布器类似于傅里叶波的波峰和波谷,它们逐渐被挤压,直到它们最终在任一方向上都消失。事实上,这正是它的本质。相关波在任何地方都有一个与中央驼峰一样高的振幅,其频率与吊具的上下摆动频率相同(图 2.2)。
吊具来自数学,而不是现实世界,但它可能会让你想起一颗落在静水中的鹅卵石,涟漪向外辐射,它们的高度随着距离的增加而降低。像波浪一样,吊具永远在各个方向摆动。但是距中央驼峰一定距离的波峰是如此之低,以至于它们无关紧要。正如我们将看到的,这在现实世界中很重要。最早的图片我在正确的上下文中发现的吊具出现在 Vladimir Kotelnikov 1933 年的经典俄罗斯论文中(图 2.3)。2
图 2.2
图 2.3
1960 年代初,我在电气工程系第一次了解到本章的好主意。我们听说它来自美国电气工程师的英雄 Harry Nyquist。他在 AT&T 传说中的贝尔实验室工作——我们都梦想有一天能成为那里。但是在 1960 年代后期,当计算机科学最终成为一门独立的学科时,就我而言,在斯坦福大学,这个伟大的想法变成了克劳德·香农的想法。当谈到所有数字化事物时,香农是我们的新英雄。他是第一个在印刷品中使用比特这个词的人。作为奈奎斯特的年轻同事,他也在贝尔实验室工作。3
但这只是美国版本,这就是斯蒂格勒的地名法则发挥作用的地方:“没有科学发现以其最初的发现者命名。” (顺便说一句,这条定律并不是由斯蒂格勒发现的。)所以在俄罗斯,毫不犹豫地,这个想法的全部功劳总是归科捷利尼科夫所有。在日本,功劳归功于染谷功。在英格兰,致埃德蒙·惠特克爵士。在德国,赫伯特·拉贝。想来想去,奈奎斯特出生在瑞典。只有香农是一个真正的蓝色,出生于密歇根州的美国人。香农标签只是粗暴的民族主义吗?所有这些人都击败了香农,除了染谷之外,他只遵循了几个月的想法。大概保留给第一个发现者的命名荣誉几乎是最后一个发现者——不管怎样,在美国。4
尽管存在归属问题,但事实很清楚:这个伟大的想法——正如它在 Digital Light 中所使用的——首先由 Kotelnikov 在 1933 年清楚、清晰、完整地陈述和证明。西方人可能很难相信这样一个基本的想法是在斯大林的俄罗斯最糟糕的日子里发明的。在冷战期间,我们被教导说,俄罗斯科学即使不像李森科的生物学那样虚假,充其量只是一种衍生品或只是宣传。是时候热身一下 Kotelnikov 值得称赞的事实了。5
Vladimir Aleksandrovich Kotelnikov 于 1908 年出生在喀山,一座位于莫斯科以东约 500 英里的伏尔加河畔古城。很难想象还有一位科学家拥有如此完美的数学血统。他的曾曾曾曾祖父谢苗·科捷尔尼科夫是莱昂哈德·欧拉的学生,他是有史以来最伟大的数学家之一。傅里叶使用的一些数学可能来自欧拉。1757 年,谢苗成为圣彼得堡科学院的早期院士,该科学院由彼得大帝创立,现称为俄罗斯科学院。6
Vladimir 的祖父 Petr Kotelnikov 是喀山大学的数学家。列宁和托尔斯泰是那里最著名的两个学生,但列宁被开除,托尔斯泰也退学了。留下来的人中有著名的几何学家尼古拉·罗巴切夫斯基(Nikolai Lobachevsky)。他挑战了古希腊的欧几里得几何,提出它关于平行线的第五个假设不一定是正确的——当时这个惊人的想法最终在爱因斯坦的广义相对论中找到了归属。祖父彼得是罗巴切夫斯基的助手,然后是冠军。
毫不奇怪,弗拉基米尔的父亲亚历山大·科捷尔尼科夫也是喀山大学的数学家。但当亚历山大决定离开喀山并举家搬到基辅担任新的教学职位时,弗拉基米尔的故事才真正开始。
1914 年 8 月,当德国军队突破该市的防御工事时,Kotelnikovs 和 6 岁的弗拉基米尔抵达基辅。民众惊慌失措,从城里冲了出来,带着新来的人一起扫荡。他们以巨大的困难设法忍受了 850 英里的撤退到喀山。这个家庭已经卷入了第一次世界大战的第一次爆炸。这是决定弗拉基米尔生活和事业的许多战争中的第一场。7
他接下来的两场战争是 1917 年的十月革命和随后的红军和白人之间的内战。俄罗斯发生了翻天覆地的变化。年轻的弗拉基米尔也是——但改变他的并不是战争。在一片混乱中,他第一次听到了无线电广播。
“它是如何工作的?” 他问父亲。
“这是你还无法理解的东西。”
这一挑战使他在 10 岁时专注于广播生活。在接下来的九个十年里,他大部分时间都在无线电和通信工程上度过,这一职业与苏联的兴衰相吻合。8
“伟大的一年,可怕的一年,我们的主 1918 年,革命开始以来的第二年。” 米哈伊尔·布尔加科夫的《白卫队》就这样开始了,他对基辅可怕的、破坏性的、无政府主义的世界的描述。在第二次时机不佳的情况下,Kotelnikovs 恰好选择了这个不幸的时刻再次搬到基辅并亲身体验布尔加科夫的噩梦。教授煮肥皂,孩子们揭开窗帘缝线——任何可以用来驱走饥饿的东西。9
1924 年,亚历山大再次举家搬家,这次是搬到莫斯科。他在莫斯科高等技术学校获得了一个新职位。学校的一部分将很快变身为莫斯科动力工程学院(俄语为MEI),并成为世界领先的技术大学之一。把它想象成莫斯科理工学院。10
Vladimir,我们的 Kotelnikov,是 MEI 的第一批毕业生之一。他们最初不会接受他,因为他的知识渊源——他不是工人或农民的血统——但幸运的规则改变允许他进入,他从未离开过。他 1931 年的文凭是电气工程专业,专攻无线电。他将在该机构工作 75 年。
然后它发生了——他的奇迹年。1932 年,科捷尔尼科夫在没有明显监督的情况下独自创作了两篇论文,每篇论文都将让他永远载入工程史册。其中之一是“非线性滤波器理论”,我们不再关注。但另一个包含了他的好主意,即采样定理。他在 11 月提交了它,并于次年以没有希望的标题“论电子通信中的‘以太’和电线的传输能力”出版。
当他把它提交给 MEI 的教员时,其中一位说:“看起来很正确,但听起来更像科幻小说。” 从无到有。尽管如此,他们还是批准了它,使他走上了通往 MEI 院长的学术轨道。11
1933 年,在 MEI 担任讲师后,科捷尔尼科夫还开始为人民通讯委员会(俄语为 NKS)工作。沟通是最重要的在战争中的重要性,因此布尔什维克在 1917 年 10 月红色夺取政权的那天创建了 NKS 也就不足为奇了。科捷利尼科夫在那里成为了一名通信工程师,并最终领导了自己的研究所。他总是一只脚在象牙塔里,另一只脚在现实世界的政治和战争中。12
图 2.4
他正在路上,在两个著名的组织中拥有两篇重要的论文和职位。他准备在学术界和政府中迅速发展。在两条道路上,科捷尔尼科夫都必须像傅立叶那样与暴君共舞。
让我们不要对无限这个词感到害羞。实际上有许多不同类型的无穷大,但我们这里需要的只有两种是数字类型和模拟类型。熟悉的时钟秒针波图(图 2.4)将有助于清楚区分。
您会记得,在秒针绕表盘转动的每一个周期中,钟面上的每分钟标记都会在波浪上出现一个圆形黑点。随着秒针在表盘周围移动,圆点永远向右展开。他们有多少人?好吧,你可以数一数——一、二、三,等等——但你必须永远数数。那就是数字无限。总是有另一个。出于显而易见的原因,数学家称其为可数无穷大。
第二种无限,模拟无限,并不那么容易。考虑波浪上的两个连续点。点之间的波上有多少点?答:有很多你都数不过来。模拟无穷远大于数字无穷——听起来很奇怪。数学家 Georg Cantor 证明了这是真的,这就是他的意思:
在波浪的任意两点之间,总会有另一点。例如,有一点——在波浪上——在两点之间。现在想想那个中点和左边的两个原点。他们之间有道理吗?是的,总是——例如,它们之间的中间点。现在重复这个四分之一点和两个原始点的左边。以此类推,无穷无尽,正如表达式所说的那样。困难在于您永远无法将其划分得足够细以结束划分过程。换句话说,你永远无法到达一个甚至可以开始数数的地方。数学家喜欢称它为不可数无穷大,但我会坚持使用模拟无穷大。两者都有效:平滑的事物具有模拟或不可数的无限部分。离散事物具有数字或可数无穷大的部分。从深刻的意义上说,数字小于模拟——即使你使用很多点来表示平滑的东西。
图 2.5
但 Kotelnikov 的好主意似乎是——令人惊讶的是——数字等同于模拟。数字化不会丢失任何东西。一个离散的数字事物可以忠实地代表一个平滑的模拟事物。图 2.5 显示了一段声音片段,或者说是沿着一条水平线穿过它的视觉场景的片段。Kotelnikov 的想法在这两种情况下都有效。底部的直线是零响度或零亮度级别——完全无声或完全黑暗。曲线是声音随着时间的推移而变化的响度,或者是当你沿着一条线向右移动时视觉场景的亮度变化。在任何一种情况下,大点都会突出显示片段中等距的点。我们将通过这个一维示例建立直觉,
图 2.6 是如果你忽略平滑曲线上的所有点,除了大点处的点。在这些点之间,我们现在只有一条直线,即零响度或零亮度级别。不难想象二维版本会是什么样子。想想水平和垂直间隔相等的不平整的钉床。它们的高度会根据作为视觉场景的相应光滑表面上的亮度而变化。钉床将是一个“表面”,除了钉子外,其他地方都为零。
图 2.5 为模拟,图 2.6 为数字。后者中的尖峰很自然地称为模拟曲线的样本。在二维的钉床情况下,指甲是相应模拟表面的样本。Kotelnikov 的好主意说,我们不需要完全平滑的曲线来表示声音,也不需要完全平滑的表面来表示视觉场景。我们只需要样本。换句话说,第一张图中高亮点之间的点的模拟无穷大可以忽略不计!他似乎在说没有什么可以代表什么。怎么可能?答案当然隐藏在“似乎”中。
图 2.6
您可能会想,如果您只是使用更多样本并将它们“足够接近”放置,它们将成为模拟声音曲线。许多人都有同样的直觉,即像素——无论它们是什么——间隔足够近将成为它们所代表的视觉场景。但这种直觉是错误的。你不能靠得足够近。你不能让数字无限达到模拟无限。你无法计算不可数的东西。然而,Kotelnikov 似乎说你可以。是什么赋予了?
此外,他的想法是,在第二张图中,显示的点足够接近——通过采集更接近的样本,你不会获得任何优势,也不会获得额外的信息。你还困惑吗?我希望如此,因为我们正在触及问题的症结——以及它的优雅。
随着这些问题在空中颤抖,我们几乎已经准备好第一次通过 Kotelnikov 的好主意了。但首先让我们回顾一下傅立叶的想法,因为科捷尔尼科夫的想法依赖于它。傅立叶告诉我们,模拟声音或视野可以用波的总和来表示。图 2.7 显示了我们一直在使用的模拟片段的波总和中的一个波,为方便起见,在顶部重复(用点指定样本位置)。您可以看到片段中没有任何东西比这个波更快地上下摆动,所以这个波是频率最高的那个。片段的傅立叶和中的所有其他波都具有较低的频率,否则您会在片段中的某处看到更快的摆动。
这是 Kotelnikov 的好主意:如果您以最高傅立叶频率的两倍对平滑的东西进行采样,那么您总是可以仅使用样本准确地恢复平滑的东西。样本是离散的、不连贯的、彼此分离的——绝对不平滑。这是他想法的第一部分——伟大的采样定理——表示可以用数字脱节性代替模拟平滑度的部分。第二部分告诉我们如何从数字样本中实际恢复原始模拟。
图 2.7
科捷尔尼科夫站在巨人傅立叶的肩膀上。傅里叶频率捕捉模拟图像在视野中的变化速度。然后 Kotelnikov 的伟大想法告诉我们如何数字化表示傅立叶波。令人惊讶的是,对于变化最快的波的每个周期,只有两个样本就足够了。直观地说,它需要两个,因为一个样本代表该波的波峰部分,另一个样本代表波谷部分。
Kotelnikov 的视野样本在数字世界中有一个名字。我们称它们为像素。就在那里!这就是像素的定义。它与傅立叶和科捷尔尼科夫密切相关。Kotelnikov 的采样使 Digital Light 成为可能。
像素不是小方块!这可能会让您感到惊讶,因为它们经常以这种方式表示——事实上,许多人经常将像素与相邻的小方块等同起来——这可能是对新生数字时代最普遍的误解。像素化这个词甚至使这种误解制度化。
事实上,像素没有形状。它们只是在规则网格上采集的样本——不均匀的指甲床。它们只存在于一点,因此它们没有范围、没有宽度、零维度。你看不到它们,它们也没有可见的颜色。它们只有一个代表灰色阴影的数字,或三个代表颜色的数字。正如我们将看到的那样,使用 Kotelnikov 的想法,从数字中恢复模拟,似乎给出了像素形状。
像素这个词本身必须为生存而战。最初,像素被称为许多其他东西——例如点、点阵列、光栅元素、图片点和图片元素。图片元素赢了,但随后发生了一场关于用速记表示该术语的斗争。多年来,IBM 和 AT&T 一直努力将其承包给pel。但是凭借他们的候选像素,1960 年代中期充满活力的年轻图像处理社区战胜了大公司的努力。事实上,在像我这样在动荡的 1960 年代成长起来的计算机图形学家中,禁止 Big Blue 和 Ma Bell 的pel是一种反主流文化的荣誉。理查德·里昂(Richard Lyon)仔细研究了变体词的使用方式和时间,在 1965 年加州理工学院喷气推进实验室的弗雷德·比林斯利(Fred Billingsley)的文件中发现了像素的最早出现,特别是在其图像处理实验室(见图 2.8,并注意KC 表示每秒千次循环)。根据里昂的说法, pel最早的公开使用来自 1967 年麻省理工学院教授威廉·施赖伯 (William Schreiber) 的一篇论文。
图 2.8
许多专利在 1970 年代发布,包含像素或pel,每年像素专利的数量大大超过 pel 专利的数量。不出所料,这个时代的大多数pel专利都分配给了 IBM 或 AT&T 的贝尔实验室。如果 Nyquist 或 Shannon 为像素使用了一个词——他们没有——那肯定是pel,Ma Bell 的词。13
像素直接调用采样定理;采样和像素在出生时就被加入了。奇怪的是,声音样本没有像像素这样的词,尽管 Kotelnikov 的采样同样的技巧使数字声音成为可能。不幸的是,采样在音频中具有不同的含义。例如,在嘻哈音乐中,这意味着借用他人的整段音乐,价值几秒钟,然后将它们放在一起,或者将它们混合在一起。在这本书中,一个独特的词非常方便,所以我使用soxel(声音元素的缩写)作为声音样本的名称。
一个更严重的命名问题出现了,因为在今天的美国,Kotelnikov 的采样定理几乎总是归因于香农。如果你忽略世界其他地方,很容易看出原因。克劳德·香农在美国是一个响亮的名字。在他 1948 年的论文“通信的数学理论”中,他陈述了采样定理。在他 1949 年极具影响力和经典的论文“存在噪声中的通信”中,他陈述并证明了采样定理,其形式现在通篇使用数字世界,尤其是数字光。随着他在美国赢得许多最高奖项——例如,国家科学奖章和广大电气和电子工程师协会 (IEEE) 的荣誉奖章,他的地位不断提高。他是第一位获得 IEEE 信息理论学会同名克劳德 E. 香农奖的人,因为他创立的领域。在国际上,他获得了第一个京都奖,相当于数学科学的诺贝尔奖。14
克劳德·埃尔伍德·香农于 1916 年 4 月 30 日出生于密歇根州的佩托斯基。他在附近的盖洛德长大,据说他在他家和朋友家之间的铁丝网围栏上制作了一条粗糙的电报线。他喜欢杂耍、密码和国际象棋。他是一个顽皮的天才。他骑着独轮车穿过麻省理工学院的大厅,在那里他获得了博士学位,后来又穿过了贝尔实验室的大厅,在那里他发明了信息论。他在一个盒子里制造了一台机器,它只做一件事:当你拨动侧面的开关时,盖子打开,伸出一只手臂,然后拨动开关。
香农是密码学大师,他在 1945 年写了一篇名为“密码学数学理论”的机密论文。在第二次世界大战期间,他分析了用于富兰克林·D·罗斯福和温斯顿·丘吉尔之间安全通信的 X 系统。香农能够在数学上证明其加密方案是牢不可破的。香农也是存在噪音的通信领域的重量级人物,这实际上是他 1949 年论文的标题。他展示了如何在整个太阳系中发送数字信息,从而消除在途中因宇宙噪声而发生的损坏,从而揭示原始信息。香农的想法使得从好奇号一路可靠地发送火星电影成为可能流动站到你的笔记本电脑上——所以很自然地,香农的名字被附在了采样定理上。但这不是香农的主意。他自己也是这么说的。15
“这是传播艺术中的常识,”他在 1949 年的论文中写道。“它以前曾由数学家以其他形式给出,但尽管它具有明显的重要性,但似乎并没有明确地出现在传播理论的文献中。” 16
但是通信界的某个人早在香农之前就已经以正确的形式和完整的证明陈述了采样定理。Kotelnikov 早在 1933 年就这样做了,比这早了十多年。为什么香农不提他?也许是因为早期的论文是作为晦涩的俄罗斯会议论文集的一部分发表的,而香农根本不知道。但正如我们将看到的,他保持沉默的原因很难确定。他本可以在二战期间俄罗斯和美国共享的非常秘密的科学背景下了解科捷尔尼科夫的采样定理。但两国之间的冷战分裂会在那些年里,香农要么无法公开他对定理的了解,要么无法了解它。
图 2.9
这是两个并排的巨人(图 2.9)。1932 年,24 岁的科捷尔尼科夫在左边——留着更狂野的发型——比他证明采样定理早一年。右边是身材苗条的香农,年龄未定,但可能是 32 岁左右,接近他在 1949 年初证明的时间。两人都是各自国家数字通信的领导者——尤其是在存在噪音或加密的情况下的通信。两人都获得了最高奖项。两者都陈述并证明了今天在数字光中使用的采样定理。
我们不禁怀疑是否存在跨文化泄漏。奇怪的是,几年后,年轻的香农经常与科捷尔尼科夫的智力成就相提并论——但我没有发现任何证据表明香农知道科捷尔尼科夫的工作。无论如何,俄罗斯人将这个伟大的想法称为科捷尔尼科夫采样定理也就不足为奇了。我们不应该吗?17
Kotelnikov 想法的后半部分——伟大的采样定理——告诉我们如何从非平滑像素重建平滑图像,并准确地做到这一点。这令人惊讶的是,数字图像中似乎几乎不存在任何信息——在每对像素之间简单地省略了模拟的无穷多点。数字音频和每对索素也是如此。采样定理的后半部分告诉我们在哪里可以找到那些缺失的无穷大。
图 2.10
以下是如何从数字中恢复模拟。用传播器传播每个像素,这是本章的基础形状。将结果相加。而已。采样定理告诉我们,这种扩展和相加过程准确地再现了像素之间缺失的无穷大!与所有伟大的定理一样,这样的推论一点也不明显。我们必须相信数学。
运行示例将再次提供帮助,但为简单起见仅显示了两个 soxel(图 2.10),即两个中心点。(我们将很快将其扩展到像素。)回想一下,soxel 是模拟声音曲线的样本,其中曲线在零线上方的高度代表它的响度。因此,索素的高度代表了索素采样点处曲线的响度。右侧的索克索比左侧的索克索声音更小——更安静。
首先,我们将传播我们在图 2.1 中看到了带有撒布器的左侧索素。回想一下,它以与原始片段的最高频率的傅里叶波相同的频率摆动。它在中央驼峰处的最大振幅(响度)代表音量一直向上。要进行撒播,请将左侧索素替换为撒播器的副本(图 2.11)。我想说的是,这会将 soxel 从无形状(无)传播到显示的形状(有)。它的最高点——中央驼峰的顶峰——与它所取代的索克具有相同的响度。两个索素显示为虚线。特别是,这清楚地表明了扩展器的高度(其最大响度)与左侧索克的高度相匹配。在本例中,响度为全音量的 80%。想象一下,您有一个用于调节响度的旋钮。
现在将扩展器的另一个副本移动到右侧索素上方的位置(图 2.12)并旋转旋钮,直到其最大响度与该索素的响度相匹配,在本例中为全音量的 50%——因此散布第二个索素。
这是将这两个“spread soxels”相加的结果(图 2.13)。在每个水平位置,取那里散布的 soxels 的两个高度(浅灰色),从零响度线测量,并将它们加在一起以获得粗曲线上的一个点。
图 2.11
图 2.12
图 2.13
到目前为止,我忽略了现实。吊具——本章的特色形状——在现实世界中并不存在。它无限广阔。它继续永远地左右波动。显然,现实世界的吊具不可能如此广泛,因此现实世界的吊具必须是理想吊具的近似值。
一种流行、实用且非常精确的吊具称为立方吊具(图 2.14)。请注意它与理想吊具的中间部分有多相似,包括存在两个负向波瓣(低于零响度线)。在中心样本的左侧和右侧两个样本(即由撒布器传播的那个)之外,立方撒布器在任何地方都为零。换句话说,它具有有限的宽度,因此它可以存在于现实世界中。
图 2.14
图 2.15
到目前为止,我所描述的是一维传播。声音仅在一维(时间)上变化,因此它是索素的准确图片,但不是像素的准确图片。像素扩展器必须在二维中扩展,因为图像在二维(空间)中扩展,通常称为水平和垂直。像素散布器必须将每个钉子(像素)散布在钉床中,以便每个“散布像素”都有助于我们可以看到的二维表面。您可以认为前面的图准确地显示了像素散布器在水平维度上的横截面,请记住,垂直维度上的横截面是完全相同的。但我们可以做得更好。
图 2.15 显示了一个完整的二维像素扩展器。将断头台从其最亮的地方扔下——这样刀片就可以将这座小山切成两半,从山顶到底部,如图所示。然后显示的出血边缘正是上面的立方分布器。如果你把小山切成两半,你会看到同样的边缘。由于这个像素散布器在每个维度上都是一个立方散布器,所以它被称为双三次散布器。它是Adobe Photoshop(最古老和最流行的像素应用程序之一)中内置的那种,用于更改图片的大小。
图 2.16
图 2.17
所以现在让我们展开并添加一行像素,但让我们使用这个双三次展开器而不是理想的展开器来实现。为了简单和一致,我们将在横截面中执行此操作。但是想象一下,每个吊具实际上是一座小山,就像我们刚刚看到的那样——不平坦的钉床在另一个维度上延伸,每个钉子上都有一座小山。首先,我们散布像素(图 2.16)。
然后我们将它们全部加起来,以获得无处不在的亮度。图 2.17 显示了沿着通过视觉场景的一条水平线的结果。粗体亮度曲线重建了原始模拟片段,为了便于比较,我在其下方重复了该片段。它并不完美——只是一个近似值——因为我们使用了一个不太理想的吊具,但它很接近。与原始钥匙相比,它就像一把磨损或重复的钥匙。双方的牙齿都打开了锁。
你可以想象,这些数字——对于十几个像素来说已经很复杂了——对于比如一百万个像素来说会变得非常复杂。重要的一点是每个步骤都很简单:将吊具移动到位,调整其亮度,然后将其添加到其他吊具上。我们有一种野兽,它可以一遍又一遍地重复简单的步骤,而不会感到困惑或无聊——当然是计算机。这就是为什么接下来的两章是关于计算机及其惊人的能力来放大(用大写字母A!)一个微不足道的人类步骤——比如说——将一个像素扩展一百万或十亿倍,而且做得非常快,更不用说将所有这些散布像素加起来。一个加法很简单——即使是人类也能做到——但它需要重复一百万或十亿次。这就是为什么我们需要计算机来真正实现数字光,尽管 Kotelnikov 和傅立叶的数学表明我们原则上可以做到。
让我们再次穿越魔法。有人在很远的地方——比如在北京——拍摄了一个事件的视频,也许是一场歌剧,或者是一个声音的录音,也许是一场音乐会,然后把大部分都扔掉了,只保留了一些样本。也许这些像素或索素流是从距离地球数千英里的通信卫星上反弹回来的,或者通过万维网运送给旧金山的你。在您访问它之前,该流可能已经存在于计算机文件或 DVD 中的某处多年。在穿越时空的所有旅程中,原始的模拟无限消失了。它所存在的只是你看不到或听不到的像素或索像素。即使您最终将它们下载到您的计算机或手机上,模拟无穷大仍然丢失,您仍然无法看到或听到它们。然后神奇的事情发生了:你决定看像素或听索素。在那一刻,我刚刚描述的传播和添加——重建——发生了,你会看到北京人在许多英里或几年前所做的完全模拟的无限信息。
丢失的无穷大只有在屏幕或扬声器上显示时才会重新出现——而不是之前。我们认为我们正在携带图像或声音,但我们不是。我们正在运输一种高度压缩的形式。上个世纪的旧媒体——例如电影和视频——确实保留了从源头到通信通道到显示器的整个路径上的模拟无穷大。新媒体将其缩写为数字样本,并且仅在最后一刻重新发明原始模拟图像或声音。
所以这就是采样定理的秘密,以及为什么它不是真的一劳永逸。我们使用的任何吊具,无论它是否理想,都是模拟形状:它具有模拟无限点。通过在每个像素上放置一个扩展器(无穷大的小斑点)并将结果相加,我们有效地在任何地方重新引入了模拟无穷大。像素之间明显的空白被像素扩展器中携带的东西所覆盖。这是一个非常巧妙的技巧。采样定理重新包装了无穷大。数学的力量将我们从直觉的束缚中解放出来,这在科捷尔尼科夫的伟大想法中得到了充分发挥。
图 2.18
像素在被散布器散布之前是没有形状的。我经常将它们绘制为侧视图或正视图,以方便绘图,作为适当高度的尖峰。图 2.18(左)显示了运行示例的中心两个像素。
表示像素的另一种方法是从上方查看它们,可以这么说,这样您就可以自然地“看到”它们。但是我们看不到像素。它是我们看到的散布像素。那么,从上方看,散布像素是什么样子的——也就是说,当我们实际查看像素时?图 2.18(中)是使用 Photoshop 的双三次散布器散布的两个像素的图片。这是两座小山,从它们的山峰上往下看。左侧较浅的散布像素几乎看不到,但它就在那里,与较暗的像素重叠。
两个展开的像素肯定不像图 2.18(右)中的邻接正方形。
如果您必须为像素指定形状,则使用散布像素的斑点图像作为指导,并记住与相邻像素的重叠。但真的,真的,像素没有形状。这是一个直径为零的点。只有散布像素有形状。如果它是一个你可以看到的像素——如果它有一个可见的形状——那么它一定是一个扩展的像素。
很容易理解小正方形概念的来源。常见的应用程序支持这种错觉。我在 Photoshop 中制作了这个小图 2.19(左,仔细看)。它是白色背景上的 14 个灰色像素簇,太小而无法轻易看到。当然,您实际上并没有在这里看到 14 像素。您会看到 14 个散布像素。
几乎所有像素应用程序都有一个称为缩放的功能,或者一些变体。缩放旨在向您展示图片的近距离外观,就好像它是通过放大镜观看的一样。图 2.19(中)显示了使用 Photoshop 的 Zoom In 将 14 个像素放大 16 倍的结果。
图 2.19
那么像素肯定是小方块,对吧?一点也不。Zoom 使用了一种快速而肮脏且不准确的技巧,让您认为它在“放大”。缩放只是将每个像素水平重复 16 次,然后将每行 16 个相同的副本垂直重复 16 次。结果是每个原始像素都被替换为 16 x 16 的相同颜色像素的正方形阵列。所以每个数组看起来——真是令人惊讶——就像那个颜色的正方形。但每个正方形绝对不是一张原始像素特写的图片。这是一张200多张的照片每个原始像素的(扩展)像素,排列成一个正方形。Zoom 技巧在过去计算机速度慢的糟糕时代很有用,但在现代世界中,它只是具有误导性。是时候摒弃像素是小方块的概念了。从来都不是真的。
图 2.19(右)向您展示了原始图片的真实样子,当 Photoshop 将 Photoshop 适当放大 16 倍时(具有称为图像大小的功能)。采样定理的后半部分解释了为什么你会看到斑点,每个斑点的中心都是原始灰色,但在各个方向都迅速软化为更白的灰色阴影,部分重叠相邻的斑点。
斯大林的大清洗——大恐怖——从 1934 年持续到 1939 年。它是由克格勃的前身、臭名昭著的内务人民委员部(NKVD)实施的。许多人在臭名昭著的表演审判中被判处死刑,数十万甚至数百万俄罗斯人被送往古拉格群岛的战俘营——这些岛屿。是索尔仁尼琴向我们讲述了古拉格和正在发生的“在人们记忆中的历史上前所未有”的悲剧。18
Kotelnikov的两个暴君从这种恐怖中出现。大恐怖的权威历史学家罗伯特·康奎斯特(Robert Conquest)将领导清洗的四位强大的年轻斯大林主义者描述为“特别凶残”。其中有科捷利尼科夫的暴君格奥尔基·马林科夫和拉夫伦蒂·贝利亚。19
马林科夫于 1941 年 2 月在莫斯科向第十八次党代会的报告拉开了又一次清洗的序幕,即斯大林的秘密清洗,仅次于大清洗。马林科夫透露,工业产能锐减,无能横行。因此,就在希特勒于 6 月入侵俄罗斯之前,数十个人民委员会(俄语中的 NK——我们可能称之为联邦局或国家部门)被摧毁,尤其是通讯人民委员会 (NKS)。整个 NKS 都解散了——除了 Kotelnikov 的实验室,因为它在战时的重要性而没有受到影响。20
二战期间,斯大林领导了一个管理国家的五人委员会:马林科夫和贝利亚都是成员。贝利亚还在副手维克托·阿巴库莫夫的协助下管理内务人民委员会,他是科捷利尼科夫的第三位暴君。当斯大林创建 SMERSH(是的,你们伊恩弗莱明的粉丝,这个反情报组织确实存在)时,他让阿巴库莫夫负责。
二战后马林科夫变得强大,起初仅次于斯大林。斯大林控制马林科夫和贝利亚的技巧是将阿巴库莫夫提升到更高的位置。因此,贝利亚和阿巴库莫夫掌管着控制古拉格奴隶劳改营的国家机器。他们在列宁格勒组织了大规模处决他们的对手,并将数千人送往集中营。1953年斯大林去世后,马林科夫成为苏联总理。
但马林科夫对科捷尔尼科夫的重要性主要在于他的妻子瓦莱里娅·戈卢布佐娃。她将成为科捷尔尼科夫职业生涯中的决定性力量——他的保护者。21
戈卢布佐娃拥有一流的革命血统。她的母亲奥尔加是涅夫佐罗夫姐妹中的一员——齐奈达、索菲亚、阿夫古斯塔和奥尔加——早在十月革命之前,她们年轻时都是列宁核心圈子的一部分。其中两个姐妹嫁给了有关系的男人:Zinaida 和她的丈夫 Gleb Krzhizhanovsky 在求爱和早婚期间与列宁和他的妻子一起流亡西伯利亚。格列布是列宁的朋友,也是革命运动中最年长的人物之一,自 1893 年以来一直是党员。索菲亚的丈夫谢尔盖·谢斯特宁 (Sergei Shesternin) 是列宁信任的拥有绝密布尔什维克财务的人。22
Golubtsova 非常出色——她自己是莫斯科动力工程学院 (MEI) 的一名学生,当时女性工程师几乎闻所未闻。她也很强大,很难,而且很酷。作为一个坚定的组织者,她成为了 MEI 的长期主管,并将其变成了一个学术强国。当她为她的机构找到一位知识明星——比如科捷尔尼科夫——时,她可以而且会确保他留在那里,而不是在古拉格。如果她自己不完全是一个暴君,她非常有效地利用她的暴君身份得到了她想要的东西。23
Kotelnikov 制定了采样理论,并设计了将像素散布到图片中的理想方式。但他当时不知道这些想法将如何实际用于实践。一方面,现代数字世界有一个巨大的实际假设:实际设备,而不仅仅是理论波,将在另一端进行必要的传播和添加,以恢复您眼睛所需的模拟光。
Digital Light 之所以有效,是因为它假设丢失的信息会神奇地出现——以适当的像素散布器的形式——在过程中的某个地方,在显示的那一刻。数字声音的工作方式相同。它假设稍后某处会有一个设备将 soxels 传播到您耳朵所需的原始模拟声音中。声音的显示是一个扬声器系统和为其供电的放大器。实际上,显示是从样本中重建模拟原件(大脑需要的形式)的行为。
显示是现代世界的一个基本假设。伟大的数字融合取决于这样一个事实,即相同的像素——图像的相同抽象表示——可以通过无数种技术以无数种方式显示。
如果您用手机拍照,然后在电脑屏幕上查看,您可能会看到两种不同的像素分布。如果您在纸上查看它,毫无疑问您正在目睹不同的传播。唯一不变的是显示器后面的实际像素,由显示器重建的不可见像素,一个带有数字的点 - 如果它是彩色的,则为三个数字。Digital Light 的一项不为人知的成就是将不同显示技术的变幻莫测——毫无疑问还会有更多——减少到称为显示器的薄硬件层及其称为显示驱动程序的软件。每个制造商都有自己的显示器和驱动程序。除了像素本身,我们用户不必担心任何事情。我们的显示器进行传播。
这是一个分裂的融合。它在像素的创建和显示之间形成了一个楔子。在创意空间中,像素是简单、纯粹和通用的。在 Display Space 中,橡胶与道路相遇。现实世界技术的所有肮脏问题都与传播创意空间提供的像素的问题有关。在这里,数千家制造商的工程专业知识专注于在实际物理材料(等离子、液晶、荧光粉、墨水)的现实限制范围内对理想吊具进行高质量近似。我们用户需要担心的只是创意空间的柏拉图像素。这就是为什么我敦促传播可以感知的像素不应与不能感知的实际像素相混淆。让我们不要将稀薄的展示空间与广阔的创意空间混为一谈。
显示器制造商通常将显示器中的小发光元素称为“像素”。但这会将扩展像素与像素混淆。这些应该称为显示元素,而不是像素。这些显示元件之一的辉光——发射的照明,在中心高,从中心逐渐减小到零——是特定显示设备的散光器。一个像素进入显示元素,一个扩展像素出来,这就是你实际看到的。一般来说,发光形状是制造商独有的,甚至在同一家公司的产品之间也会有所不同。
所以,这就是 Digital Light 的工作原理:它从现实世界中提取像素,甚至从火星或金星——或者从我们将看到的计算机内部的虚幻世界——中提取像素并将它们发送到各处。这些像素只携带离散的位置和强度(或颜色)信息。似乎来自像素的实际光仅在您用眼睛看到它之前的最后一刻由显示设备产生 - 而不是在世界各地或我们姐妹行星之间的任何中间位置。原始画面的流畅度只会重新出现在显示屏中。如果像素的原始创建做得很好,根据采样定理,并且如果将这些像素重建为模拟显示器也做得很好,也根据采样定理,那么您所看到的就是原始的准确表示。我们做从无到有。像素是虚无——它没有维度——而显示器上显示的彩色光斑就是某物。采样定理使这个方案成为可能。没有它,数字世界就不会存在。
“扰频器的想法是通过人工手段再现人声。. . 通过将至少主要谐波加在一起来重现它,每个谐波都由一组单独的脉冲传输。你当然熟悉笛卡尔直角坐标——每个男生都熟悉——但是傅立叶级数呢?”
——亚历山大·索尔仁尼琴,在第一圈24
1936 年,当 Kotelnikov试图使其更广泛地传播时, Electrichestvo ( Electricity ) 期刊拒绝了 Kotelnikov 的论文——具有采样定理的论文。但那一年还有一件更耐人寻味的事情:科捷利尼科夫访问了美国!我对此有所暗示,并能够找到他下船记录的图像。上面显示他有60天的签证,他的旅行是由苏联政府支付的,他的目的地是纽约市的Amtorg贸易公司。25
Armand Hammer 于 1924 年成立了 Amtorg,以促进苏联和美国之间的贸易。他是一个迷人的人,是美国共产党创始人的儿子,他以美国社会主义工党的“手臂和锤子”标志命名。Armand 是一位著名的商人(西方石油公司的负责人)、慈善家和艺术品收藏家。
但 Amtorg 不仅仅是一家贸易公司。它是工业和军事间谍活动的温床。事实上,一份解密的 NSA(国家安全局)报告显示,美国在 1931 年花费了大量精力试图破解在 Amtorg 和莫斯科之间使用的密码。美国的努力失败了,因为“俄罗斯人使用一次性密码本进行加密”。26
这一点特别有趣,因为依赖一次性预共享密钥的一次性密匙加密系统在接下来的十年里都没有被证明是有效的。Amtorg 间谍显然至少在没有证据的情况下信任它这么长时间。尽管我们并不确切知道 Kotelnikov 在 1936 年在那里做了什么,但创建和破解密码似乎比交易更有可能。
或者他正在收集一次性垫使用情况的数据——因为证明一次性垫系统可靠性的人是 Kotelnikov。他在 1941 年 6 月 22 日希特勒入侵苏联前三天提交了他的证明。也许并不奇怪,香农也证明了一次性垫系统的可靠性;它于 1945 年出现在机密出版物中,并于 1949 年公开发表。27
Kotelnikov 一定是在他的实验室里完成了他的一次性工作——这是斯大林秘密清洗之后唯一的 NKS 通讯委员会残余。该实验室幸存下来是因为军方迫切需要其无线电通信方面的机密工作。但随着德国人在 1941 年末迅速逼近莫斯科,科捷利尼科夫没有抓住他们可能突破的机会。他将他的实验室疏散到乌法,比喀山更东约 300 英里,莫斯科以东 800 英里。28
在斯大林格勒战役期间,俄罗斯前线一直依赖有线通信,并且在不可避免地出现电线故障时遭受了严重损失。Kotelnikov 的实验室生产了通过无线电而不是电线进行通信的安全设备,到 1943 年,战场上的军队开始使用这些设备。同年,他因其发展而获得了他的第一个斯大林奖。后来,在 1945 年 5 月,当局使用实验室的设备在德国签署投降协议时将莫斯科与苏联代表团联系起来。次年,科捷尔尼科夫获得了他的第二个斯大林奖。29
当实验室从乌法返回莫斯科时,它落入了内务人民委员会的控制之下。在这个危险时刻,莫斯科动力工程学院(MEI)新任院长戈卢布佐娃挺身而出,提出科捷尔尼科夫可能愿意回到她的机构,他的母校。他抓住了这个机会。她的干预将他作为绝密项目的负责人从 NKVD 的监狱系统中解救出来。30
在苏联,成功是危险的。有成就的科学家和工程师是 sharashka 的饲料。sharashka 监狱是内务人民委员会在古拉格经营的臭名昭著的秘密科学研究和开发监狱之一。索尔仁尼琴也向我们介绍了它们。它们是他的天堂岛. 许多科学家和工程师被囚禁在天堂,以确保特定的导弹、飞机或核弹只献给俄罗斯母亲。被送往俄罗斯偏远省份严寒的可怕劳改营的囚犯被饿死、冻死,甚至被活活打死。sharashkas 中的“特权”囚犯吃得饱饱且温暖。但是他们仍然在监狱里,通常是几十年。这些是迄今为止人类设计的最令人惊讶的监狱——为最优秀和最聪明的人而设的监狱,他们离开的希望渺茫。31
Marfino sharashka(图 2.20)位于莫斯科北部的前顿悟修道院,专门用于秘密通信设备和安全系统。如果没有戈卢布佐娃,科捷尔尼科夫可能会到那里救了他。他的乌法实验室的其他成员当然做到了,成为其首席科学家和设计师。亚历山大·索尔仁尼琴也这样做了。他的小说《第一圈》讲述了他在 1947 年至 1950 年间生活的这个沙拉什卡的生活。32
图 2.20
在第一圈是一个罗马谱号。索尔仁尼琴本人由两个角色代表,而斯大林则以他自己的身份出现。它还有负责 sharashkas 系统的 Beria 和 MGB 的负责人 Abakumov——NKVD 的后裔和克格勃的前身。这部小说包含一个有趣的角色,弗拉基米尔·切尔诺夫,一位数学家、教授和院士,与 MGB 有着特殊的关系——肯定代表弗拉基米尔·科捷尔尼科夫。考虑以下两个来自In the First Circle 的引文:
切尔诺夫教授是马菲诺监狱唯一免于穿工作服的囚犯。阿巴库莫夫本人已被要求授权。
切尔诺夫被派到马菲诺研究一个万无一失的扰频器的数学原理——一种自动旋转开关继电器组的装置,从而混淆了电脉冲发出的顺序,从而扭曲了人类的声音即使是配备一百个类似设备的一百个监视器也不会有丝毫的机会解读谈话内容。33
Vladimir Kotelnikov 是一位数学家、教授和(未来的)院士,与 MGB 有着特殊的关系——也就是说,受到 Golubtsova 的保护——是语音加扰设备方面的专家。他承认他曾使用贝尔实验室的 Homer Dudley 于 1939 年发表的一篇声码器或语音编码器论文作为俄罗斯扰频器开发的基础。34
小说中的下一段引文将这一切联系在一起:
“什么?你是什么意思,人工语音设备?” 一名囚犯向阿巴库莫夫报告。“我们这里没有人这么叫。他们在反对向外国科学磕头的运动中更名了。这是一个声码器。语音编码器。或者加扰器。” 35
1947 年,真正的阿巴库莫夫把科捷尔尼科夫叫到他的 MGB 办公室,并向他概述了一个专门研究“绝对安全受限”的无线电电话设备的实验室。在第一圈中,这表明特殊设备是偏执狂斯大林的直接要求,而囚犯索尔仁尼琴在马菲诺工作。阿巴库莫夫提议让科捷利尼科夫担任专业实验室的著名负责人,并以津贴和特权使这笔交易更加甜蜜。令人震惊的是,考虑到他正在对付的凶手,科捷尔尼科夫拒绝了这个提议。
“嗯,很遗憾,”阿巴库莫夫回答,结束了会议。
阿巴库莫夫很可怕,连贝利亚都怕他。Kotelnikov 被这句结束语吓得要死,立即去找 Golubtsova,告诉她发生了什么事。
“嗯,你自己想要什么?”
“去MEI工作。”
“然后继续像以前一样冷静地工作,”她建议道。36
她又救了他。
科捷尔尼科夫实际上代替斯大林的扰频器或除此之外所做的事情来自于 1947 年在 Golubtsova 的 MEI 办公室举行的一次会议的记录。著名的俄罗斯火箭科学家鲍里斯·切尔托克向她报告了他的导弹开发 sharashka 的需求。
“在很短的时间内,这次会议的结果超出了我们最乐观的预期。39 岁的 Vladimir Kotelnikov 教授负责开发我提出的想法,”他回忆道。“在我与 MEI 科学家会面大约十天后,Golubtsova 的办公室发布了斯大林签署的关于在 MEI 建立一个特别行动部门的政府法令。一年后,团结在科捷利尼科夫周围的集体已经在开发 Indikator-D 系统,我们在 1948 年第一批 R-1 国产导弹的飞行试验中使用了该系统。从这一开发开始,所有后续导弹都配备了 MEI试飞期间的无线电系统。” 37
R-1 是俄罗斯版的 V-2,德国用来轰炸伦敦的沃纳·冯·布劳恩的火箭。
“1951 年,MEI 集体参加了一项创建遥测系统的竞赛,第一枚 R-7 洲际导弹配备了现在具有传奇色彩的 Tral 系统。”
R-7是他们的第一个洲际弹道导弹(ICBM)。
MEI“团结在 Kotelnikov 周围的集体”是俄罗斯首字母缩略词 OKB MEI 正式已知的 sharashka,大概是在 Chertok 运行他的 sharashka NII-88 时,由他从受保护的位置领导。科捷尔尼科夫对太空竞赛的贡献由此开始。38
到目前为止,我所说的好像像素可以代表任何亮度级别。但是模拟曲线上的一个点是一个模拟值,这意味着它可以具有任何模拟无穷大的值。严格来说,图片亮度的模拟样本不是像素。它只有在转换为比特时才成为一个像素,然后它才会传播成为您在显示器上看到的光晕。一个数字样本,例如一个像素,只能采用某些离散值,它们的数量是有限的。
在我们在接下来的章节中讨论计算机之前,一些“计算机语言”在这里很方便。众所周知,位可以有两个值,通常称为 1 和 0。将位视为电灯开关。它有两个位置,通常称为上下。考虑两个电灯开关。他们可以担任多少职位?嗯,它们可以同时上升,或者都下降,或者以两种不同的方式一个上升另一个下降。所以答案是四个。换句话说,两个位(灯开关)可以有四个值。三可以有八个值。正如我们已经注意到的,第三个开关可以向上或向下,另外两个开关可以处于四个不同的位置。二乘四等于八。一般来说,随着电灯开关的数量增加一,开关可以采取的不同位置的数量增加一倍。为您省去麻烦,
在计算机图形学的前几十年,通常将黑白图像的像素限制为 8 位。这意味着一个像素可以代表仅有的 256 种灰度中的一种。例如,值 0 和 255 可以分别代表黑色和白色,中间分布有 254 种其他灰色。但模拟曲线上的实际值可能是 49.673。要做什么?好吧,最接近的可用灰度值 50 将附加到该点的像素,因此当稍后将其重建到显示器上时,会在图片中引入一个小错误。亮度的微小舍入误差有多严重?50 是否“足够接近” 49.673 无关紧要?什么是像素亮度“足够接近”?
在这种情况下,我们确实可以选择“足够接近”的值。医生,尤其是放射科医生,会在显示器上阅读 CAT 扫描和 MRI 扫描,并根据他们看到的情况做出诊断。因此,医疗行业的显示器制造商已经精确地测量了人类的灰度感知。他们提供的图表显示,普通人可以在我的特定桌面显示器上区分 630 种灰度。所以有两点很清楚。首先,过去只有 256 个可能值的 8 位像素还不够好。但是,其次,一个 10 位像素,有超过一千个可能的值就足够了。当您在一千多个选择中四舍五入到最接近的值时,人眼无法看到引入的错误。现代数字图像现在使用 16 位灰度像素,具有超过 65000 种灰度。这对于愚弄人脑来说已经绰绰有余了——任何人都可以进行任何展示。声音显示中的 16 位索像素也是如此。39
您是否听过发烧友说 LP(或黑胶唱片)比 CD 更好?在视觉世界中,声称数码摄影永远无法与胶片摄影的微妙之处相提并论。这样的主张往往充满激情。他们有实质内容吗?嗯,当然有。有几种方法可能会导致错误地进行数字采样 - 每个像素或每像素的值不够、散布器糟糕或不够高采样频率。但这些主张的许多拥护者认为,他们批评的是数字化存在本质上的问题,而他们真正批评的是执行不力。如果一位工程师决定制作一张完全复制黑胶长播放 (LP) 专辑内容的 CD,那么理论上说她可以做到。同样,如果另一位工程师下定决心要从复制胶片照片的数字图像中打印出来,那么理论上说他可以做到。这两种情况都不容易。该理论必须尽可能接近理想地实践,但这是可能的。
一些发烧友声称能够区分以高于每秒 44,100 索像素 CD(光盘)标准的采样率录制的录音,该标准具有每索像素 16 位的特点。回想一下,人耳每秒可以听到高达 20,000 个周期(最高傅立叶频率),因此 Kotelnikov(或 Nyquist)采样率为每秒 40,000 索塞尔。CD 超过了 Kotelnikov 要求的从 soxels 进行完美模拟声音重建的最低要求。因此,如果该理论是可信的,那么没有人应该能够检测到使用更高采样率的系统对 CD 的改进。
专家可能能够检测到的另一种错误是舍入误差——索克的响度值数量不足。但正如已经提到的,没有人耳能做出比标准 CD 的 16 位索像素提供的更精细的区分——每个索像素大约有 65,000 个可能的响度级别。因此,对于每索像素使用更多位的系统,应该没有人能够检测到对 CD 的改进。
两种在采样率和每像素位数方面都超过 CD 的标准数字音频系统是超级音频 CD (SACD) 和 DVD-Audio (DVD-A)。一项精心控制的科学测试得出了这样的结论:
我们根据音乐类型和具体节目分析了所有的测试数据;高分辨率技术的类型;录音年龄;和听众年龄、性别、经验和听力带宽。这些变量都没有显示出与结果的任何相关性,或者答案和掷硬币结果之间的任何差异。40
换句话说,即使是发烧友也无法区分 CD 与 SACD 或 DVD-As。但是——这很能说明问题——同样的实验者报告说“几乎所有的 SACD 和 DVD-A 录音听起来都比大多数 CD 更好。” 在搜索与录音工程师的对话后,他们发现这是因为他们比制作典型 CD 录音的工程师更正确地使用了采样定理。教训是数字可以是模拟的准确表示,但必须正确完成。或者换一种说法,数字化并没有什么本质上的劣势。
昨天晚上我们忘了和朋友安排去乡下旅行。我们从床头柜上拿起一个类似烟嘴的小物件。它是我们星球上每个居民都拥有的供私人使用的接收兼传输电视机。我们发出朋友的呼叫信号并按下按钮。. . . 我们肯定会有这些小电视机放在马甲口袋里。
——Kotelnikov,预测手机,1957 41
1957 年 8 月 27 日,科捷利尼科夫第二次访问美国,就在人造卫星发射之前——这一事件震惊了美国。这是国际地球物理年,标志着冷战时期科学交流中断的结束。科捷尔尼科夫现在是苏联科学院的正式成员,他正在为美国人携带来自俄罗斯的信息。他在科罗拉多州博尔德举行的一次会议上说,苏联将很快发射一颗卫星,该卫星将以每秒约 20 到 4000 万(兆)周期的频率进行广播。他被忽略了。美国人不会相信苏联科学已经取得了如此大的进步。但在 10 月 4 日,人造卫星以每秒 20.005 和 40.002 兆周期的速度发射和广播。太空竞赛如火如荼地进行着,科捷尔尼科夫也在场。42
差不多二十年后,当它结束时,他也在那里。1971 年在莫斯科举行的一次会议上,新任命的苏联科学院代理院长科捷尔尼科夫向美国外交官宣布,由于技术原因,拟议的阿波罗-礼炮试验任务将无法运行,但苏联已准备好继续取而代之的是重命名的阿波罗-联盟号测试项目。始于 1975 年 7 月的阿波罗-联盟号联合航天项目是两国缓和的最有力象征之一。43
领导太空竞赛只是科捷尔尼科夫的成就之一。他完成了金星、水星、火星和木星的无线电定位,并因此获得了列宁奖。然后,配备 MEI 的太空任务金星 15 和 16 首次绘制了金星北部的地图——向整个太阳系发送像素。一颗名为 2726 Kotelnikov的小行星表彰了他对俄罗斯太空工作的诸多贡献。44
Kotelnikov 伟大的采样理念告诉我们将像素间隔“足够近”在一起意味着什么。如果违反了这条规则,就会发生坏事。您可能已经看到了结果:阶梯状边缘、马车车轮向后旋转、出现莫尔条纹条纹领带,或电子游戏中令人不快的背景闪光。这些文物是大数字融合早期的祸根。“是”,而不是“曾经”。我最近看了导演米开朗基罗安东尼奥尼的伟大电影l'Avventura和La Notte的 DVD 。在l'Avventura中,令人惊艳的 Monica Vitti 的波点连衣裙因采样错误而受损。她的裙子不规则地闪烁,仿佛波点是随机切换的小灯。几乎每一帧La Notte在被错误采样的窗户和建筑物的边缘闪闪发光。这样的数字伪影不仅是不必要的,而且是不可接受的。它们不是数字世界固有的,但它们是对采样定理的不知情使用的迹象。或者,在电子游戏的情况下,游戏计算机没有足够的能力来正确地进行采样。
如果您没有以足够高的速率进行采样,则会出现这些令人不快的伪影。采样定理说你必须以两倍最高傅里叶频率对视觉场景进行采样。因此,要么您必须以更高的速率进行采样以消除丑陋的伪影,要么您必须在采样之前消除场景中过高的频率。实用性通常决定后一种路径。
频率峰值的直觉是锐利的边缘意味着高频。非常尖锐的边缘意味着非常高的频率。多高?无限高以获得完美锐利的边缘——也就是说,频率如此之高,你不可能处理它们。当然,您不能经常采样以准确表示它们。所以实用性再次介入。一般来说,要用像素表示一个场景,你首先必须摆脱它太高的频率,它太尖锐的边缘。窗口边缘就是很好的例子。有缺陷的La Notte DVD 的制作人显然没有遵循采样定理。他们在采样之前没有去除过高的频率,结果很丑陋——或者至少让人分心。
有一种简单的方法可以从视觉场景中去除过高的频率。只需稍微散焦图片 - 但不要让您真正感觉到图片失焦。这种微妙的“涂抹”了所有的边缘。采样定理告诉你散焦多少就足够了。
科捷尔尼科夫一生中最可耻的一幕——至少在许多西方人眼中——是 1975 年的安德烈·德米特里耶维奇·萨哈罗夫事件。萨哈罗夫是苏联氢弹之父之一,他已经放弃使用核武器,并积极争取不扩散核武器. 他和另一位持不同政见者索尔仁尼琴都受到苏联媒体的诽谤。但是萨哈罗夫获得了 1975 年的诺贝尔和平奖。作为回应,苏联科学院的成员发表了一份声明,谴责他和奖项。作为学院代理院长,科捷尔尼科夫向政治局提交了一份关于该事件的报告:
我们特此报告,该学院的 72 名成员签署了苏联科学家的声明,抗议将诺贝尔和平奖授予 AD Sakharov。45
该报告还列出了五位拒绝签署声明的院士,其中包括另一位苏联氢弹之父维塔利·拉扎列维奇·金茨堡。作为回应,政治局禁止萨哈罗夫前往奥斯陆接受诺贝尔奖,1975年10月25日,科学家们签署的声明发表在苏联官方报纸《消息报》上。金茨堡写到科捷尔尼科夫在这件事中的角色:
我们的谈话相当平静。VA [Kotelnikov] 在恳求我,而不是威胁或恐吓我。总的来说,他是在毫无热情地完成任务,但那是他一贯的作风。我拒绝签字。
金茨堡继续说道,将当前时代(1991 年)与斯大林统治下的非常严酷的时代进行了对比:
我想我会在人身胁迫下签署这封信。. . [但是]显然没有被殴打或逮捕的危险,我仍然很困惑为什么这么多人签署了这样的信。46
事实上,金茨堡和其他四人从未因拒绝而受到惩罚。Kotelnikov 和其他签名者是否还在遭受斯大林时代的恐惧?不管它的动机是什么,这封信只会增加对萨哈罗夫在西方持不同政见的支持,并使他成为英雄。47
从萨哈罗夫事件的角度来看,值得记住的是,1950 年代美国也发生过类似的事情。学者们转向美国原子弹之父 J. 罗伯特·奥本海默 (J. Robert Oppenheimer),他同意萨哈罗夫对进一步使用核武器的看法。
像傅立叶一样,科捷尔尼科夫不得不巧妙地与他的暴君共舞——而且显然是这样做的。他在这方面非常成功,以至于在萨哈罗夫的信中,他除了领导科学院外,还担任着惊人的高位。因为科捷利尼科夫是俄罗斯最高苏维埃主席,苏联最大共和国的最高立法机构!八年。这怎么可能?
“一开始我很好奇,”他在30 年后告诉《消息报》记者。“系统是怎么运作的?然后我明白了。它尽可能简单。发言的人是中央亲自挑选的,发言稿是事先通过的。” 他补充说:“这一定是我一生中最轻松的工作。不过,最引人注目的。命运的讽刺。” 48
也就是说,这是一个没有实权的职位。这是一个闲暇,本质上是他长期为国家服务的另一个奖项。
很明显,为什么今天“街上”的普通人不知道像素是什么。它需要了解采样定理,这需要了解傅里叶频率。公众通常不熟悉这些美丽而优雅的想法。然而,它们是数字媒体的基本理念——实际上,是一种通用的比特媒体。数字媒体主宰当今世界以及可预见的未来。本章和前一章试图传授对这个新世界的外行理解——对这两个伟大思想的直观理解。它们很容易总结:
现实世界以一种明显连续的方式呈现给我们的感官。傅立叶的想法告诉我们,真实的连续世界可以描述为各种频率和幅度的波的总和——视觉世界可以被认为是我们眼睛的音乐。
采样定理教我们如何用离散样本来描述那些傅里叶波。因此,值得注意的是,视觉世界的模拟无穷大可以准确地编码为离散的、分离的、不可见的样本。在视觉世界中,这些样本称为像素。采样定理还告诉我们如何从这些离散样本中重建世界的连续表示:只需用散布器传播每个样本并将结果相加。在显示的时刻,每个离散像素在像素附近为重建的视觉场景贡献了一小块模拟无穷大。我们的眼睛理解这种重构的连续性,就像他们理解原始场景一样。
这两个基本思想背后的人类戏剧与思想深刻一样引人入胜。傅立叶对拿破仑了解太多,因此几十年来,拿破仑将他从巴黎驱逐到外省。但效果是,傅立叶不受知识资本的喧嚣影响,创造了他的伟大想法,即世界是波浪的总和。Kotelnikov 被凶残的马林科夫的妻子 Valeriya Golubtsova 保护免于被关押在古拉格,在漫长而极其成功的职业生涯中继续发展他的采样定理的结果。傅立叶是在法国大革命中形成的;Kotelnikov 在俄罗斯的扩展革命中——从 1917 年十月革命到第二次世界大战和冷战。罗伯斯庇尔和拿破仑是傅立叶的暴君;斯大林、马林科夫、贝利亚和阿巴库莫夫至少间接属于科捷尔尼科夫。
在像素的传记中,我们会反复发现收到的故事不一定是正确的。正确的往往比收到的要好——而且是真实的。Vladimir Kotelnikov,而不是美国的巨人克劳德香农,首先将采样定理带到了世界。
这两个人之间的相似之处是不可思议的。Kotelnikov 多年来一直担任苏联(今俄罗斯)科学院无线电工程与电子研究所所长,现在以他的名字命名。美国庞大的电子电气工程师协会 (IEEE) 最初是同名的无线电工程师协会。它将荣誉勋章授予香农,并在 2000 年将亚历山大·格雷厄姆·贝尔奖章授予科特尔尼科夫,标志着千禧年和大数字融合。具有讽刺意味的是,亚历山大·格雷厄姆·贝尔也与贝尔实验室同名——著名的香农的故乡。49
尽管科捷尔尼科夫将采样定理带到了世界,但具有讽刺意味的是香农将它传授给了美国。如果不是因为香农从来没有为自己主张过采样定理,我们可能会援引“同时发明”的现象。我们将在下一章再次见到香农,国家安全将再次成为暴君——但这次是西方安全。
2003 年科捷尔尼科夫 95 岁生日——在他证明采样定理七十周年之际——在克里姆林宫的凯瑟琳大厅,普京总统授予他为服务勋章的全骑士(替代翻译:Chevalier、Knight)祖国,只有第四位持有该命令的人(图2.21)。Kotelnikov 于 2005 年 2 月 11 日去世。他只比香农多活了四年,但他们都看到了他们帮助定义的新千年和新时代。50
图 2.21
下一章的主要目的是将数字光从现实世界扩展到虚幻世界。它的重点是数字光的第三个伟大的基础理念——计算。到目前为止,我讨论的像素都是从现实世界中派生出来的。例如,这包括科捷尔尼科夫从金星极地地区拍摄的那些像素,或者就此而言,我们每天用手机摄像头捕捉到的无数像素中的任何一个。另一方面,计算让我们创造了非常丰富但完全虚构的世界。它让我们从头开始生成或制作像素。当这些像素根据采样定理展开和添加并显示到我们的眼睛时,我们看到了一个不存在的世界。这怎么可能?
瓦伦丁:之前没有足够的时间。铅笔不够用!这花了她我不知道多少天,她还没有刮伤油漆。现在她只需要按一个按钮,一遍又一遍地按同一个按钮。迭代。几分钟。而我在几个月内所做的事情,只用一支铅笔,计算将花费我余生再做一次——数千页——数万页!而且很无聊!. . .
汉娜:你的意思是那是唯一的问题吗?充足的时间?还有纸?和无聊?瓦尔!这就是你说的吗?. . .
瓦伦丁:嗯,另一件事是,你必须疯了。
——汤姆·斯托帕德,阿卡迪亚1
计算机是一个被伪装成设备的存在难题。虽然电器不是超凡的,但计算机更是如此。首先,它是人类发明的最具延展性的工具。它允许我们做比我们想象的更多的事情。其次,它是人类大脑中最强大的放大器。它把我们做这些事情的能力提高到了难以想象的水平。延展性和放大是计算的双重荣耀。
最先将全面的计算理念带给我们的人——他的话——是艾伦·马西森·图灵(Alan Mathison Turing),他具有非凡的天赋。
他于 1912 年 6 月 23 日(一个世纪前)出生在伦敦,几乎正好在前一章的英雄科捷尔尼科夫和香农的出生之间。图灵在 22 岁时成为剑桥国王学院的研究员,在 34 岁时获得大英帝国勋章,在 38 岁时成为艾萨克·牛顿皇家学会会员,并在 6 月 7 日时死于 41 岁时的氰化物中毒, 1954. 所以——不像Kotelnikov 和 Shannon——他没有看到新千年和大数字融合。2
在 1960 年代,图灵对我们第一代计算机科学专业的学生来说是个谜。我们被教导了他的伟大想法——计算的概念——但他自己仍然是一个密码。从原本笼罩着他的迷雾中升起的是他已经自杀的持续谣言。
然后突然间,在 1983 年,安德鲁·霍奇斯出版了传记《艾伦·图灵:谜》,这最终使图灵这个人成为了人们关注的焦点。它解释了这个谜团:图灵帮助破解了纳粹德国的 Enigma 密码并赢得了战争。但他在布莱切利公园的工作是绝密的,并被英国的官方保密法扣押了数十年。3
超越这一启示是另一回事。当同性恋仍然是一种犯罪行为时,图灵就已经是公开的同性恋了,甚至是鲁莽地这样做了。当他在1952年因“不雅行为”被捕时,他无法利用他拯救了英格兰的事实来拯救自己。不雅行为胜过《保密法》。考虑到监狱或化学阉割的选择,他选择了阉割。他的马拉松运动员的身体(图 3.1)从荷尔蒙和发达的乳房。也许,正是这种屈辱驱使他吃了一个(可能)毒苹果——在一个本可以直接从迪斯尼白雪公主中取出的死亡场景中。4
图 3.1
由剑桥大学国王学院图书馆提供。
传记作家霍奇斯本人是国王学院的理论物理学家,也是英国同性恋解放运动的成员,他终于揭开了神秘的面纱。他得到了完整的故事,并仔细、亲密、很好地讲述了它。5
在 1950 年代的美国,在参议员约瑟夫麦卡锡的恐怖统治下的“薰衣草恐慌”中,共产党人和“性变态者”被归为国家的敌人。英格兰也遭受了同样的错觉,尤其是在 1951 年以及臭名昭著的受过剑桥教育的间谍和同性恋者盖伊·伯吉斯 (Guy Burgess) 叛逃到莫斯科之后。图灵对共产主义从来没有任何兴趣——他对此嗤之以鼻——而且他是如此公开坦率的同性恋,以至于他不可能被勒索。但麦卡锡和军情五处没有做出这些区分,而图灵有共产主义朋友。6
剑桥大学著名的秘密社团 Apostles 将 Burgess 列为其成员之一。他们中的许多人是马克思主义者或同性恋者或两者兼而有之。图灵的两个最好的朋友和合作者罗宾·甘迪和大卫·尚佩诺恩也是使徒,这对图灵的事业没有帮助。尤其是甘迪,在学生时代是共产党员。
每个人都同意图灵死于氰化物中毒,但他是如何中毒的仍然存在争议。毒苹果自杀是最流行的理论。但实际的苹果从未进行过氰化物测试,为其他解释敞开了大门。他的母亲认为这是一场意外。但另一种说法是政府安全部队暗杀了他。7
具有讽刺意味的是,在图灵毒尸被发现后的第二天,麦卡锡的反共恐怖统治终于落下帷幕。1954 年 6 月 9 日那天,美国陆军首席法律顾问约瑟夫·韦尔奇斥责这位参议员,因为他试图暗杀另一个被指控为共产主义的人。
英国政府最终在 1967 年放宽了虚伪的反同性恋法律,并在 2009 年为其骇人听闻的错误公开道歉。但这两个事件都来得太晚了,无法阻止“圣。图灵。” 2012 年全球庆祝他诞辰 100 周年为他辩护——最终在 2013 年圣诞节前夕女王的死后赦免结束。8
傅立叶的法国恐怖和科捷尔尼科夫的大恐怖都极其致命。麦卡锡的恐怖,以及相应的英格兰环境,不在同一个联盟中,但它们仍然毁掉了成千上万的生命——并直接导致了图灵的死亡。图灵的暴君不是皇帝也不是党主席,而是国家安全。他没有在肉体上被监禁,但他被《官方保密法》在精神上囚禁——在一个隐喻的布莱切利公园 sharashka 中。
在图灵的故事中,我们再次找到了技术突破的要素:他的伟大计算思想;第二次世界大战的混乱和恐惧推动了计算机的发展,这些机器实现了他的想法;以及国家机密的暴政,将科学家集中在一个地方,并以一种不正当的方式保护他们。
计算机是机器的变形虫。它的本质是它的普遍性,它的模拟能力。因为它可以有千种形式,可以服务千种功能,所以它可以吸引千种口味。
——Seymour Papert,《头脑风暴》,1980 年9
计算机在每个步骤中所做的事情都是微不足道的。一个典型的步骤是这样的:从这里取一些比特,稍微旋转一下,然后把得到的比特放在那里。旋转可能只不过是将每个 0 换成 1,反之亦然,或者每个 0 或 1 向右移动一个位置。
这些简单可笑的步骤串在一起的长序列使计算机变得强大。这并不明显——无意识的步骤应该导致有意识的结果。那么愚蠢的序列如何变得有意义呢?魔法在哪里?
随机序列没有什么有趣的。但是一个有意义的序列会导致计算机执行一个有用或有趣的过程。您知道的任何计算机或手机应用程序都是由一系列简单步骤执行的过程。另一个序列产生了皮克斯电影。
计算机硬件所做的很简单——那些微不足道的步骤。但要创建这些步骤的有意义的序列,需要相当大的智力。那就是软件设计。具有这种能力的有创造力的人是程序员。所以,魔法就在他们的脑海里。
这就像一架音乐会三角钢琴。钢琴可以演奏无数的音调。那是执行简单步骤的硬件。大多数序列只是噪音。但偶尔会出现一些产生美妙音乐的软件。由程序员肖邦诱导的音符序列变成了练习曲、华尔兹或马祖卡。
一台计算机,就像一架钢琴,可以实现无数简单的基本步骤序列。因此,它可以实现无数复杂而有意义的流程它们——可以说是它的音乐——只使用 2 位而不是 88 个钢琴键。正是“无数”这个词捕捉了延展性的超越性,这是一种对计算机至关重要的品质,以至于它应该获得“大写 M”的地位。我们人类的思想被计算机可以实现的广泛的可能过程所淹没。总是有另一个有意义的无意义步骤序列来产生我们想要使用的东西。总有另一个应用程序、游戏或电影要构建。而一个工具,计算机,可以完成所有这些。
事实上,延展性本质上是计算的一部分,正如我们将在本章中看到的那样。这是概念的礼物。但延展性的荣耀伴随着一个谜团——不可知性的谜团。尽管计算机采取的每一步都是完全可预测的,但我们并不总是知道这些步骤的顺序将如何展开。在小处确定并不意味着在大处确定。必须确定一个计算——必须有一些关于一系列完全确定的步骤将做什么的答案——但我们并不总是知道那个答案。确定和预定之间的细微差别是潜伏在计算核心的奥秘。因此,计算机简单而深刻。
另一种非常不同的超越是放大。很明显,计算机可以重复一个动作——它的任何无意识步骤的序列。这很简单。重要的是它可以以我们无法理解的速度重复这个动作无数次。不是无数次。我们可以计算重复次数——或者至少我们的计算机可以。我们只是无法理解与我们人类思维有关的数字。淹没我们的是计算机进程的规模。11-11 skydillion 是一个虚构的愚蠢数字——斯克罗吉叔叔遇到比尔博巴金斯——但它让人想起计算中的数字是多么愚蠢,即使它们是实际数字。我们无法想象它们。正如斯托帕德的瓦尔在题词中所说,“你必须疯了”才能对付它们。精神错乱可能还不够。10
重复您已经对计算机进行编程的任务是微不足道的。只需指示计算机根据需要多次重复该任务。几乎不需要额外的智力努力。但是,与这种简单性相反的是加速计算机以达到难以想象的数字所需的智力。这就是硬件设计。具有这种能力的创造性人类是工程师。
在电气工程中,放大意味着增加很多。指数是衡量“很多”的方式——例如,不仅仅是两倍或三倍,而是平方或立方。增加不是 2 倍或 3 倍,而是 2 的指数或 3 的指数好几倍——不仅仅是 2 x或 3 x,而是x 2或x 3。如果输入信号是 10 伏,那么放大后的输出不仅仅是 20 或 30 伏,而是 100 或 1,000 伏。放大是技术的礼物。最早的计算机的建造正是因为它们可以超越人类——它们可以增强人类的能力。
第一台计算机将人类能力提高了 10,000 倍。到 1965 年,这一因素已跃升至 1,000,000——至少——是通过制造更大的机器并将基础技术从真空管转换为晶体管而实现的。我们将其称为 Epoch 1 加速。
但超越放大——放大本身的指数放大——伴随着更现代的技术——集成电路:大量晶体管和它们之间的导线在一个芯片上。1965 年,现在被称为摩尔定律的声明是开启下一个显着加速的绿旗——第二纪元。人类的能力不仅被计算机以指数方式放大,而且,这种放大的速度也以指数方式增加。
简而言之,摩尔定律暗示放大率将每五年上升到 10 的下一个指数——下一个 10 的因子。因此,如果人类的扩增在 1965 年是 10 6(100 万)——事实上——那么它在 1970 年将是 10 7 (1000 万),在 1975 年是 10 8(1 亿),以此类推。它会让早期计算机的创造者感到惊讶,就像今天让我们感到惊讶一样。另一个惊喜是 Epoch 2 中更强大的计算机变得更小,而不是更大。
就其本质而言,我们无法理解摩尔定律的含义。这是一个数量级的事情。我们人类通常无法看到超过 10 倍的变化。我们在那里碰上了一堵概念墙。所以我们用大的表达数量级来暗示僵局而不是平淡无奇,简单的算术因子10. 宏大的表达意味着一个如此巨大的变化,以至于只有新的思维过程——新的概念化——才能处理它。它不仅仅是更多——它是不同的。我们必须先掌握一个数量级的改进,然后才能开始思考下一个订单可能意味着什么。然而,计算机已经将人类的放大率提高了至少 17 个数量级!前六个订单(一百万倍)出现在摩尔定律之前,之后又有 11 个订单(一千亿倍)。总而言之,有一百亿倍的放大——超出任何人最疯狂的想象,无论是否天才。
计算机利用我们人类的智慧超越了我们固有的数量级限制。它将我们微不足道的人类行为放大到我们没有帮助的物种无法达到和无法想象的极端。增幅的荣耀伴随着那些数量级障碍的奥秘。
Kotelnikov 的采样定理告诉我们,相机可以将现实世界变成像素。换句话说,我们可以用相机从真实的视觉世界中获取像素——我们可以拍摄它们。然后我们可以使用它们来重建那个视觉世界的样子——即使是在更晚的时间或很远的地方。
或者我们可以从头制作像素——我们可以计算它们。如果我们显示的像素按照与现实世界像素相同的规则运行,那么我们也可以看到虚幻世界。新千年的完整数字之光源于这种想法。
我们利用延展性和放大功能为我们提供了成熟的数字光——例如,一部完全数字化的故事片,或者最热门的视频游戏,或者对国际互联网体验的即时视觉访问。计算机创建像素,并从视觉世界中获取它们。
本章是关于延展性的超越性,这是艾伦·图灵发明计算的礼物。这是关于想法的。下一章是关于速度的。它是关于硬件计算机的发明,以实现计算的想法。这是关于放大的超越,技术的礼物。这也是关于数字光的黎明——令人惊讶的巧合——与计算机同时发生。通俗地说,本章和下一章是关于摩尔定律到来之前理论和实践——科学和工程——的英雄。在后面的章节中,当摩尔定律出现并在 Epoch 2 加速中驱动放大超新星时,我们重新审视“定律”并更仔细地检查它。
尽管在预兆中的西弗没有自己的象征意义,但他对他人的象征意义却是力量。
——托马斯·乌斯克,《爱的遗嘱》,约。1385 11
图灵的重大突破始于系统过程的想法。这是一个仔细或系统地做某事意味着什么的例子。假设您家中的一位客人,您所在城镇的陌生人,想知道如何去杂货店。你的步行方向可能是这样的:走出前门,在街上右转。步行到第一个十字路口,然后再往前走两个街区。在那里的街道左转,沿着它走三个街区。继续穿过那个十字路口,商店就在右侧,从十字路口进去的第四栋建筑。
因此,直觉上,谨慎或系统意味着进入商店的较大过程被分解为一系列较小的步骤,其中每个步骤或说明对大多数人来说都是简单、明确且显而易见的。一位客人按照给定的顺序准确地执行每一项,一定会到达商店。
上面的步行路线是一个简单的说明列表。客人从列表的一端开始,在另一端结束。要遵循的指令数等于列表中的步骤数。然而,一般来说,系统化过程的结构比这更多。考虑一下将钉子钉入木板的方法:(1)取钉子。(2) 如果没有,那么你就完成了,否则继续。(3) 敲钉子。(4) 如果指甲弯曲,则将其拉直并重复步骤 3,否则从步骤 1 重新开始。
此列表与步行路线具有相同数量的说明,但在强大的方面有所不同。它有循环。只要有钉子,您就重复外环(步骤 1 到 4),只要钉子在不恰当地敲打时弯曲,就重复内部“嵌套”环(步骤 3 和 4)。你在这个列表的一端进入,你可能永远不会出来——比如说,如果你每次敲钉子时都会弯曲一个钉子。执行的步骤数通常比指令数大得多——有时甚至大得多。
钉钉方向有两个分支步骤,形式为“如果 . . . 然后 。. . 否则 。. 。” (步骤 2 和 4)。这些被称为条件分支。如果满足某个条件,则分支到某某步,否则分支到某某步。条件分支(由if表示)允许您更改执行列表中指令的顺序。
它还可以让您逃脱无限循环。例如,考虑这个:(1)说“你好”。(2) 转到第 1 步。没有条件分支可以用来转义循环。因此,一旦这个系统过程开始,它就永远不会停止。
条件分支——系统过程的if ——是计算的关键。可以执行条件分支的机器比不能执行的机器强大得多。它可以简洁地导致一个难以想象的长度的过程小心地展开。它可以实现自我循环的流程——也许是十一十一天——甚至可以修改自己作为流程的一部分。任何声称是计算机的机器都必须具有条件分支指令。一台机器可以有十层楼高,全电子化,速度极快,但如果它没有条件分支指令,那么它就不是计算机。
如果它只计算数字,那么它就不是计算机。系统过程的概念远大于数字。即使是我们第一个系统过程的例子,步行和锤击指令,也不是关于数字的。毫不奇怪,图灵很早就完全理解了这个概念。
并不是说数字不重要。它们是我们几千年来一直系统化的事情之一。即使在这个计算器无处不在的时代,孩子们仍然学习如何将两个十进制数字相加。众所周知,这样做的方法是将每对数字从右边开始依次相加,然后将它们和的一个数字写入答案。如果(就是这样!)这些数字的总和是 10 或更大,你将“1”带到下一步,向左一个位置,并将其添加到那里。等等。在这个过程中还有另一个隐含的情况:如果你用完了数字或携带 1 来添加,则停止。这是通常称为加法算法的过程的草图. 我敢肯定,我们都很高兴我们的计算器现在为我们“记住”了这个算法的细节,并且对它们足够了解,如果我们坚持的话,它们可以添加两打数字,而不仅仅是两个。
在上个世纪,算法这个词成为我们一直称之为“系统过程”的同义词。这个词是对 9 世纪波斯算术专家花拉子米名字的诬告。他在古代巴格达写了关于涉及十进制数系统的系统过程 - 一个来自印度的新概念,其中包含一个称为 0 的奇怪新事物。后来,在中世纪晚期,印度数字系统本身被称为algorism或augrym,还有两个以他的名字命名的腐败。因此,算法的概念植根于数字和数字操作——但绝不受其约束。
十四世纪的杰弗里乔叟使用奥格利姆中的名词来描述星盘上的标记。但他的朋友 Thomas Usk 以更令人印象深刻的方式使用了这个词。他的题词是关于 0 的力量——在augrym 中的 sypher。它本质上是说,虽然单独的 0 什么都不是,但附加的 0 很多。用我们的话来说,每个附加的 0 都是一个数量级的增加——确实是很多东西。他的预兆远不及我们的算法,但事后看来,他的格言似乎是对放大潜力的早熟观察。12
当算法中的步骤数变大、循环数成倍增加、嵌套层次加深、条件分支大量分支时会发生什么?通过在 20 世纪之交询问有关系统过程的问题,数学家开始摸索通往计算世界的道路,但他们还不知道。他们还没有看到延展性和放大的双重荣耀,或与之相关的奥秘。
大卫希尔伯特,一位数学家中的王子,在哥廷根大学,数学世界的中心——直到纳粹对犹太数学家的清洗摧毁了它。从 1900 年开始,希尔伯特利用他的国际声望专注于关注具体的难题,其中一些与数学本身的基础有关。这些著名的问题被命名为希尔伯特第二和希尔伯特第十。解决其中任何一个问题都会立即证明您是世界级的数学家。
1928 年,希尔伯特提出了另一个难题。这是一个简单的逻辑系统——称为一阶逻辑。数学家使用一阶逻辑来制定措辞准确的陈述,这些陈述可能是对的,也可能是错的。希尔伯特问是否有一种系统的方法,一种算法,来决定这个简单逻辑系统中的一个陈述是否正确。
这是这样一种说法:所有物体都是松果。这是另一个:所有对象都是 quinces。系统中始终允许的复合语句是通过将任意两个其他语句与单词or组合而成的:所有对象都是 pinecones,或者所有对象都是 quinces。系统有一条规则,允许您用重新排列的与其等效的语句替换此组合语句:所有对象都是 pinecones 或 quinces。这里的词等价意思是如果前者为真,则后者为真,如果前者为假,则后者亦为。因此,单词的重新排列不会改变陈述的真值。简单的重新排列将两个最初的陈述折叠成一个陈述,其中或在松果和木瓜之间。这似乎很明显,但关键是这个逻辑系统中的每一步都使用简单甚至微不足道的操作将一个语句转换为等效的语句。新声明源自旧声明。
推导是此类步骤的序列,其操作就像在每个步骤中应用的or规则一样简单。到目前为止,我们所描述的是一种系统的方法,它可以在每一步都保持真或假的方式来导出一个又一个陈述。如果你从真实的陈述开始,推导总是会产生真实的陈述。
这是数学家感兴趣的真实陈述。它们从非常简单的——显然是正确的——陈述开始,并使用逻辑系统从中得出更多真实的陈述。他们开始的真实陈述被称为公理。例如,一个数等于它自己是一个公理。这显然总是正确的。数学令人敬畏的荣耀在于,即使每一步都很简单明了,这种推导也可能导致完全出乎意料的结果。
但希尔伯特要求的是一种决策算法,而不是推导。他并没有要求系统化过程实际上从公理中生成陈述的推导——只是它准确地确定推导是否可能。区别似乎并不重要。如果您可以确定一个陈述是正确的,为什么说明它实际上是如何从公理推导出来的很重要?事实证明,这非常重要。13
在学术的家族谱系中,我们可以知道,17 世纪的约瑟夫是今天在世的詹姆斯的直系祖先,但他们之间并没有正式建立父子关系,即世代相传。如果它们在 Y(雄性)染色体上共享相同的 DNA——一个简单的实验室测试证实了这一点——那么它们一定是由一个雄性系相关的。它们之间必须存在一条路径。但知道一条路径的存在与了解将特定 DNA 传递给男性线的实际男性系列完全不同——这通常很难确定。知道这样一条路径的存在可能会鼓励您花费研究精力来寻找实际路径——要知道您没有在徒劳的搜索中浪费时间。
因此,希尔伯特在 1928 年提出的一个大问题是,简单逻辑是否有一个技巧——就像 DNA 测试一样——可以系统地决定一个陈述是否为真,而无需实际从明显为真的公理中推导出来。这被称为希尔伯特的 Entscheidungsproblem。
这是一个令人生畏的名字,但它只是德语中的决策问题。是否有系统的方法来确定以简单逻辑表达的陈述的真值?然而,把它放在德语中,肯定会提高它对英语读者的深度。决策问题听起来像是一个商学院的话题,但 Entscheidungsproblem 建议一个 Götterdämmerung 来撼动和更新世界,这实际上就是它所做的。让我们称它为eProblem,因为它导致了电子邮件——并且说 Entscheidungsproblem 很快就会变得令人厌烦。
1934 年在英国,Max Newman 在剑桥大学的一次演讲中提出了 eProblem。他说的是一个系统的过程,但“机械过程”是他实际使用的术语。纽曼的措辞是关键。他也可以说“系统过程”、“有效过程”、“配方”或“算法”等等。这个概念还没有确切的词。这正是问题所在。14
学生艾伦·图灵参加了那场讲座。极度字面意思的图灵开始用简单的纸“机器”将纽曼的“机械过程”形式化。纽曼肯定对他自己的学生感到惊讶——这么年轻(只有 22 岁)而且笨拙!结结巴巴!——在那场决定性的演讲后不久,用一台简单的机器解决了深刻的电子问题。事实上,纽曼一开始并不相信。这台机器看起来像一个玩具——不是严肃的数学。当然,如此深刻的数学结果不可能来自如此简单的设备。但他很快就对图灵的结果深信不疑。15
图灵使用他的机器——当然现在称为图灵机——来解决 eProblem。首先,他发明了计算——这正是图灵机所做的。然后他使用计算——对我们所说的系统或机械过程的精确描述——来解决问题。逻辑推导中的简单步骤序列可能会提醒您计算机采取的琐碎步骤的顺序。这两种情况都会从无意识的单个步骤中产生一些注意事项。图灵是第一个正式将两者联系起来的人,这让他成为了数学界的神。
他表明,简单的逻辑没有技巧 DNA 测试。如果你能找到一个,你必须做完整的推导。不可能有希尔伯特要求的那种算法。正如数学家所说,图灵发现简单的逻辑是不可判定的。如此出乎意料和令人不安的结果,就连伟大的希尔伯特一开始也不相信。如果图灵没有做任何其他事情——比如拯救英国或发明计算——这将使他进入科学万神殿。他解决了其中一个难题。但正是他的机器——而不是他对 eProblem 的解决方案——让他在数学以外的更大世界中出名。现代计算机是图灵机器的直接概念后代。
在图灵解决 eProblem 的同时,新泽西州普林斯顿大学的 Alonzo Church 也在解决这个问题。大约在希尔伯特宣布 eProblem 的时候,美国数学家 Church 已经在哥廷根大学完成了研究生工作。事实上,Church 比 Turing 早了几个月的时间。按照学术界的规则,教会赢了,荣耀通常都是他的。但是图灵的求解技术与丘奇的截然不同。在数学中,证明方法通常与证明本身的事实一样重要。纽曼认为数学界应该知道图灵的新方法。
纽曼敦促丘奇承认图灵的贡献,丘奇做到了。他们都在 1936 年通过印刷论文上市。这是一大步,因为启发计算机诞生的是图灵的直观、工业、甚至民俗机器,而不是 Church 的深奥形式化(lambda 可定义性)。它们是等价的概念——图灵在他的论文中证明了这一点——但图灵对词语的选择却产生了截然不同的后果。他们俩解决的难题对 Digital Light 来说并不重要,但图灵的解决技术——他的机器——才是。16
这两种方法预示了一场仍然定义计算机科学的小冲突——象牙塔与臭气熏天的战斗。“带着臭味出去”是剑桥大学的俚语,用于获得自然科学学位——化学首当其冲。图灵在剑桥数学的无味、干净的象牙塔中构想了他的计算的伟大想法,但启发计算机的是他坚韧、真实的工业模型,而不是丘奇的纯数学概念。计算机科学仍然沿着这条线分裂。它与一些大学的数学和其他大学的工程混为一谈。延展性是一种塔现象,而放大是一种臭名昭著的荣耀。疯狂冲向第一台计算机的玩家将不得不跨越高塔-臭气熏天的鸿沟。17
图灵并不是唯一一个将系统过程的概念正式化的人。正如我们所见,Church 也这样做了,还有其他几个。但是图灵的方法是如此有影响力,以至于其他方法相形见绌。在我们的普通世界中,我们仍然使用他在 1936 年的开创性论文中在剑桥引入的概念。他的词可计算是卡住的词。他还给了我们编程的想法,尽管他没有这么称呼它。这使他成为第一个程序员。而且,唉,他是第一个编写有缺陷的软件的人。18
他是另一个计算机传统的第一个例子。他古怪的性格——强烈的字面意思、对错误的诚实、社交尴尬和对服装的漠视——使他有资格成为第一个极客。也许我们现在会说他“在光谱上”。19
纽曼担心图灵很快就会成为“被证实的孤独者”,并告诉了丘奇。纽曼认为,与普林斯顿大学的逻辑精英——会说同一种语言的人——交流可能会扭转这种趋势。于是他要求丘奇接受图灵为研究生,丘奇再次答应了。图灵将在美国教堂获得博士学位。
图灵乘坐轮船Berengaria前往美国,于 1936 年 9 月在曼哈顿下船。这只是一个巧合,但 Kotelnikov 最近于 5 月降落在那里,也在Berengaria上。俄罗斯人只逗留了 60 天,可能参与了曼哈顿市中心 Amtorg 贸易公司的密码工作。图灵到达时,他已经启程回家了。两艘船在黑暗中经过,可以这么说——在同一艘船上。
在这个巧合之后不久就形成了真正的联系。图灵从曼哈顿前往附近的普林斯顿大学学习。然后,他的导师纽曼来到普林斯顿进行了为期六个月的访问,访问了邻近的高等研究院——有时称普林斯学院以将其与大学区分开来(并将演讲者从 IAS 口中拯救出来)。约翰·冯·诺依曼(John von Neumann)——这个故事中的另一位重要人物——已经在王子学院作为其首批永久学者之一。20
要了解图灵的好主意,请考虑图 3.2 中的名片。它有一个角被切除,中间有一个圆孔。正面(有版权)和背面都刻有铭文。您可以欣赏这张卡看似简单的欺骗性,但不要被愚弄——它非常强大。
想象一下卡片后面有一条从左到右的纸带。它被分成方格,通过卡片上的洞你可以看到一个方格。磁带大部分是空白的,但通常有一个或多个带有符号的正方形。在这种情况下,我选择了非空白符号作为数字 1、2、3、4 和 5,但它们也可以是 #、!、$、% 和 &。关键是它们是不同的标记,没有意义。特别是,它们不是数字。我们称它们为符号,但它们没有任何象征意义。只需将 1 替换为 #,将 2 替换为 !,等等,在此名片设备的描述中到处都是,没有任何变化——除了方块上标记的形状。
图 3.2
图 3.3,第 1 步(顶行)显示了一个磁带,上面只有四个标记:5155。磁带的其余部分是空白的。该卡显示为略微透明,以便您可以通过它看到胶带。卡片右侧的奇怪标记列表——带有圆圈的数字、冒号、箭头等——包含了管理该设备的六个规则。磁带上每个可能的符号都有一个规则。卡片左侧的倒置列表还有六个规则。
名片设备是这样工作的。找到孔中符号的规则。(不要注意颠倒的规则。)对于第 1 步,它是右上角的规则,即空白处的规则。空格后面有一个冒号,后跟一个 5。它说用 5 替换空格——在空格中写一个 5。5 之后是左箭头。它说将卡片向左移动一格。规则右侧的小字形代表名片本身。它说您应该旋转卡片以匹配字形的方向。在这种情况下,这意味着将卡片顺时针旋转半圈,将裁剪的角放在西北位置,从而产生步骤 2 配置。
适用于第 2 步的规则位于右下角,用于孔中的符号 5。它说将 5 更改为 2——擦除 5 然后写一个 2——然后向右移动一格。这次没有小卡片字形,所以卡片保持相同的方向。步骤 3 配置就是结果。
图 3.3
向前跳过两个步骤给出步骤 5 配置(步骤 4 未显示)。在这些步骤中,卡片保持相同的方向(西北)。在这种情况下应用的规则是从右上角开始的第三个规则:将 2 更改为 3,向左移动一格,然后将卡片旋转到所示方向。这里的意思是把卡片翻过来,把裁剪好的角落放在西南。这揭示了卡片的另一面(如步骤 6 所示)和另外两个不同于我们目前看到的两个列表的规则列表。
依此类推。如果你进一步追求这种乏味,你会发现这张牌最终会回到原来的方向,洞里有一个 4。适用的规则没有冒号的权利,这意味着没有其他事情发生。计算停止。
这不是一场闲置的游戏。不管你信不信,目标是Digital Light。名片设备是图灵机。这是图灵的玩具之一。这是图灵最著名的发明的硬件实现。
在 1930 年代,“计算机”是一个人——通常是一个女人——执行例如保险公司的簿记过程,或者后来 Bletchley Park 的密码破译过程。在与他的母亲 Sara 的谈话中,图灵将在那里为他工作的数百台“计算机”称为“奴隶”——这表明了系统(或“机械”)过程的惩罚性质。21
图灵捕捉到了“计算机”在仔细执行系统过程(例如添加几十个数字的列表)时用铅笔和纸做的事情,也许会用茶歇来打断工作。图灵机是他设计的模型,它捕捉了他们所做工作的本质简单性。
但它并没有捕捉到他们的乏味。单调乏味——正如你已经发现,如果你遵循了上面的说明——来自于小步骤的不断重复,不断担心错误,以及努力跟踪——比如说,在茶歇期间。它也没有捕捉到他们的无聊。回想一下斯托帕德的汉娜:“无聊呢?瓦尔!这就是你说的吗?” 机器不会感到乏味或无聊。这些都是人的问题。图灵创建了一个抽象模型,说明“计算机”的作用。他把她的乏味从存在中抽象出来,认为是无关紧要的。他坚持诸如不同的心理状态、多个步骤、书写和擦除符号以及无休止的草稿纸供应等概念。
名片可能采用四种可能的方向或状态,并且有六个符号(计算空白)。因此,卡片的每个方向都有六个规则,每个可能出现在孔中的符号一个。一般规则是,每一步孔中的符号可能会改变,孔向左或向右移动一格,卡片方向可能会改变。或者它可能只是停止。这里的所有都是它的。22
图灵将他的每台机器定义为只有四样东西:一维磁带分成正方形,一组有限的符号,一个带有限元的磁带扫描仪状态数,以及一个“指令表”,告诉您如何处理扫描仪状态和磁带符号的每种组合。在我们运行的示例中,磁带扫描仪是一张有孔的名片,六个符号是数字 1 到 5 和一个空白,四个状态是卡片的四个方向。四组规则构成指令表。还有一件事。磁带在任一方向上都尽可能长。如果您需要,总会有另一个广场。总是有更多的草稿纸。也许你现在可以理解为什么纽曼起初无法相信如此简单的设备——它看起来像是一个玩具——会产生一个深刻的数学结果。但是从这个简单的“机器”概念中产生了所有的计算。
您可能会在名片设备中瞥见现代计算机。磁带扫描仪——卡——是 CPU(中央处理器),磁带是内存。但是现代计算机可以执行任何计算,只需更改其程序,无论这意味着什么。当然,我们简单的名片设备不能执行任何计算,不是吗?这是惊喜。是的,它可以。皮克斯可以用它计算玩具总动员!然而,他们不想这样做,因为它太慢了,可能会占用整个宇宙的生命周期,但速度是一个可分离的问题,将在下一章中讨论。关键是我们的设备不仅仅是任何普通的图灵机。名片机是通用的图灵机。23
图灵的伟大想法不仅在于图灵机可以执行系统化过程——我们所说的“系统化过程”或“机械化过程”正是在图灵机中体现出来的。但这本身就是一个很好的主意。加法算法——如何将两个数字相加得到它们的总和——就是这样一个过程。因此,必须有一台图灵机将其磁带上的两个数字相加,并在其磁带上生成它们的总和。并且什么都不做。
另一种系统过程是反转任何字母串的过程。例如,给定abcdefg,它交换最外面的一对字母,然后是下一个最外面的一对,依此类推。它继续进行,直到没有更多的对可以交换,或者直到只剩下一个字母,在这种情况下产生gfedcba 。因此,存在一台图灵机,它将对其磁带上的任何字符串进行这种反转,而不是其他任何东西。
然而,图灵的大师之作是展示了一台图灵机如何能够完成任何其他图灵机所能做的事情。它可以执行所有系统过程——包括两个数字的相加或一串字母的反转。它是一台可以计算任何可计算事物的机器。这就是通用在计算中的含义。当我们说图灵的伟大想法是计算时,我们的意思是它是通用计算。现代计算机是这种特殊的图灵机,通用图灵机的后代。但是图灵机怎么能通用呢?
不要向外行解释计算机。向处女解释性行为更简单。
——罗伯特 A. 海因莱因,《月亮是个严厉的情妇》24
海因莱因该死!图灵使他的一台机器通用的技巧很聪明。图灵机是由其规则集定义的简单事物。例如,名片机由其 24 条规则定义,卡片的每个方向有 6 条规则。所以图灵推断,必须有可能设计一个图灵机,它可以描述任何图灵机,加上该机器的输入,并模拟该机器在给定磁带的情况下会做什么。他认为这是可能的原因是这样的模拟是一个系统过程,而图灵机旨在捕捉我们所说的系统过程的意思。模拟任何其他机器的图灵机是通用图灵机,图灵展示了如何构建这样的机器。
图 3.4 中的 A 代表任何图灵机,被描绘为沿着无限长的磁带左右移动的扫描头。名片机就是一个例子。它的“扫描头”就是卡片上的孔。名片将是我们运行任意图灵机 A 的示例。U 是一个通用图灵机,可以模拟任何图灵机 A,给定 A 的规则的一维描述 - 它的指令集 - 和 A 的磁带数据的描述.
在我们的示例中,A 的规则就是指定名片机的 24 条规则。它们被编码成UA 要求的格式。名片上的规则是以两张二维指令表的形式写在名片的两侧,其中一半倒置。U 的磁带上需要这些规则的一维版本,写在 U 在那里使用的符号集中。我们将很快展示 A 规则的示例编码。
图 3.4
A 的数据是指最初出现在其磁带上的非空白符号——例如,5155 是前面示例中名片机的初始数据。它也被编码成 U 所需的形式。我们还将展示 A 的数据编码示例。换句话说,通用图灵机磁带上的初始数据 U 由 A 的规则和A 的数据组成,呈一维形式,如图所示。
图灵注意到任何图灵机的规则集都可以写成一行符号。对于名片示例,如果您对名片的四个方向(正面、背面、旋转正面和旋转)使用一个符号缩写 f、b、F 和 B,则可以在一行中列出所有 24 条规则返回——将规则分成这四组,每组有六条规则:
(六f规则) (六b规则) (六F规则) (六B规则)
请参阅注释以了解此编码的实际外观。
图灵的第一个技巧是将单行机器描述写到 U 的磁带上,每个磁带方格一个符号。把它想象成写在磁带的左半边。
图灵的第二个技巧是在 A 的描述右侧写一个 A 的磁带的单行描述,包含它的初始数据。这里的编码很简单。所以我们的名片机的描述和初始数据可能是这样的,使用竖线分隔两者,使用 0 编码空白:
(六f规则) (六b规则) (六f规则) (六B规则) | 000000051550000000
在这一点上,通用图灵机 U“知道”任意图灵机 A 是什么,因为它具有对该机器行为的完整描述,如其规则所表达的那样。通用机器知道任意机器最初查看的是什么磁带。U 知道它的输入数据。
通用机器只需要知道另外两件事来模拟任意机器 A:它当前正在扫描哪个符号以及它当前处于什么状态。图灵的第三个技巧是在磁带的左侧添加一个符号,指示当前状态和另一个符号右半部分表示当前扫描的方块。关于任意机器 A 的这四条信息——它的描述、初始数据、初始状态和初始扫描符号——形成了通用机器的初始数据。下面是 U 的名片机输入磁带在背面方向的表示,在初始数据 5155 上,最初扫描右侧的空白 (0):
(六f规则) (六b规则) (六f规则) (六B规则) | 00000005155 0 000000
粗体0标记最初扫描的符号,粗体b标记卡片的初始方向,因此使用哪些规则。请参阅注释以了解 U 磁带的实际外观。
为 U 设计一组规则以便它可以模拟任意机器 A 像这样编码到 U 的磁带上是一个乏味的过程。关键是 U 可以“看到”任意机器的完整描述以及该任意机器的数据的完整描述。它可以查看任意机器的当前状态以及该机器的数据磁带当前扫描的方块。这是对要模拟的机器的完整描述。下一刻可以类似地模拟,因此图灵在他 1936 年的著名论文中设计了一个 U,可以系统地将一个时刻的表示转换为下一个时刻的表示。所以后来在模拟名片机的时候,U的磁带是这样的:
(六f规则) (六b规则) (六f规则) (六B规则) | 0000000515 5 5000000
然后它会模拟下一步,然后是下一步,以此类推。实际的构造是痛苦的,但它的要点并不难。如果您愿意失去海因莱因童贞,请阅读注释以了解模拟的更多详细信息。
图灵展示了机器 U 如何模拟任意机器 A 的每个操作步骤。仅模拟 A 的一个步骤需要很多 U 的步骤,但这对论证无关紧要——速度对于计算的概念并不重要。U 是一台通用计算机,因为它可以计算任何其他机器可以计算的任何东西。只需更改 U 磁带的描述部分即可更改计算的内容。
图灵发明了编程。用现代术语来说,图灵将任意机器的程序存储在通用机器的内存中,他也将数据存储在那里——通用机器磁带的左右两半。要更改通用机器模拟的机器——即它执行的计算——你只需要更改程序,即磁带左半部分的描述部分。
通用图灵机本质上就是我们现在所说的存储程序计算机,因为它以相同的方式存储程序和数据——都在机器的内存中。存储程序计算机就是我们今天所说的单字计算机。我们称任何特定的机器 A,如其编码规则所代表的,计算机程序,或只是程序。这也解释了为什么程序员经常称自己为编码员。他们将任意算法(由特定的图灵机实现)编码为计算机 U 所需的一维形式。图 3.5 显示了通用图灵机 U 如何隐喻地对应于现代计算机。
现代计算机几乎总是将其程序分成至少两个部分。一部分称为操作系统,或OS,例如 Windows、MacOS 或 AndroidOS。该程序部分始终在运行。这是需要无限循环的情况。为满足您的个人需求而进行更改的程序部分称为应用程序 (或app,流行)。类似地,数据存储器将对操作系统重要的数据与应用程序的数据分开保存。操作系统只是“处理事务”,例如将应用程序加载到内存中的正确位置并启动,处理鼠标或手指输入,以及监视电源故障。这是一个代表现代计算机中任意图灵机 A 的应用程序。每个算法或系统过程都有这样一个 A。这就是计算世界的基础。
图 3.5
值得再次说明图灵的成就。他表明,有一台机器可以做任何系统化的事情。它不能敲钉子或敲击钢琴键,但它可以做任何可以用符号表示的系统操作(然后符号输出可用于驱动敲钉子或敲击琴键的机器)。要改变机器的功能,你所要做的就是改变它的程序或应用程序。他发明了计算机的概念——我们指的是存储程序计算机。我们在硬件中实现它只是为了让它快速运行。
一台计算机可以计算多少个程序?它可以运行多少个应用程序?嗯,有这么多,你永远无法数完它们。这就像问一架钢琴可以演奏多少首乐曲。计算机是人类发明的最具延展性的工具。这就是延展性的奇妙之处。Digital Light 只是其无限折叠所拥抱的世界之一。
Princetitute——普林斯顿高等研究院的俚语——吸引了天才,尤其是那些逃离纳粹欧洲的天才。它已经收集了一个图灵和纽曼在 1930 年代后期抵达镇上时,这群星团虽小但令人印象深刻,图灵在读研究生,纽曼在休假。最著名的是,阿尔伯特·爱因斯坦已经在那里了。但对于我们的故事来说更重要的是,约翰·冯·诺依曼也是如此。
他于 1903 年 12 月 28 日在布达佩斯出生于 Neumann János Lajos。他的父亲是银行家马克斯·诺伊曼。1913 年,奥匈帝国政府授予马克斯高贵——大概是因为他的经济援助——这使他能够使用冯姓形式。所以马克斯的儿子在美国一直被称为约翰·冯·诺依曼。他于 1933 年永久搬到那里,并成为王子学院最早的成员之一。
约翰曾是布达佩斯富裕精英的一员,并在他的新国家继续享受贵族的生活方式。例如,他总是开凯迪拉克,但它们经常被破坏和更换,这是他个性的线索。他回答“约翰尼”,另一个线索。这张约翰尼的著名照片(图 3.6,左上角)显示他身着西装,打着领带——他平时的着装——骑着一头背对着其他人的骡子(你可能会说屁股向后),在开往 Grand 的火车上峡谷。他是一位热情而亲切的主人。他喜欢马提尼酒、可笑的派对帽和一首好色的打油诗。25
冯诺依曼因其对量子物理学和博弈论等多个领域的贡献而闻名,更不用说他在秘密的曼哈顿计划中的成员资格,以发展核武器,并随后成为原子能委员会的成员。但他也因对计算机的贡献而闻名,最著名的是一种被广泛模仿的计算机子系统的通用组织,称为冯诺依曼架构。
他是天才中的天才,是“头脑最快”的“最聪明的人”。他无疑是美国人在计算机竞赛中的常驻天才,他们的对手是英国天才艾伦·图灵。从两者的角度来看,可以很方便地总结一下,Digital Light 的知识遗产来源于存储程序的计算概念,主要归功于 Turing,以及实现该概念的架构,主要归功于 von Neumann。26
冯诺依曼短暂地参与了大卫希尔伯特对数学基础的著名挑战之一。在图灵解决希尔伯特的 Entscheidungsproblem,eProblem 之前几年,他尝试了希尔伯特的第二个问题。
希尔伯特的第二个问题是算术公理——算术的基本,甚至是显而易见的真理——是否一致。重要的是,希尔伯特认为,证明简单的算术——至少——是由一个不会导致矛盾的逻辑系统支持的。这似乎是合理的,但 1931 年库尔特·哥德尔在维也纳证明了这一点一个足够强大以支持算术并且没有矛盾的系统是不完整的。这个令人惊讶的结果,被称为哥德尔不完备定理,意味着在这样一个逻辑系统中必须存在无法在该系统中证明的算术真理。这是另一种说法:一致性的代价要求你满足于不能系统地证明一切。哥德尔的结果表明,不可能有一个通用的数学机器来推导每一个数学真理——这与图灵后来的结果(1936 年)相反,即有一个通用的计算机来处理所有可计算的事情。
图 3.6
由玛丽娜·冯·诺依曼·惠特曼提供。
哥德尔的结果与数字光的故事密切相关,因为它确立了冯诺依曼的凭据。冯诺依曼实际上是在 1930 年听哥德尔介绍他的革命性成果,在哥德尔发表之前。作为冯诺依曼能力的衡量标准,他几乎立刻就明白了,并直接向哥德尔本人提出了一个更强的结果。我们可以假设,得知哥德尔已经证明了更强的结果,他非常失望。冯·诺依曼性格的另一个一瞥是,从那一刻起,他就停止了对形式逻辑的贡献。如果他不能成为某个领域的佼佼者,那么似乎——如果他不能超越 Gödel Gödel——那么他就会继续统治另一个领域。
冯诺依曼并没有像图灵那样处理计算,尽管当图灵理论出现时他已经做好充分准备去理解它。相反,他从工程的角度出发,通过考虑实际机器的实现。在开发热核弹或氢弹的过程中,他让自己熟悉了战后 1940 年代美国制造计算机的所有尝试——计算机的直接前身。他正在寻找能够快速进行热核计算的最佳机器。特别是,他在费城找到了一台房间大小的机器,名为 Eniac,建于 1946 年。它类似于我们后来所说的计算机。事实上,他使用 Eniac 进行氢弹计算。这台“几乎是计算机”的缺陷激发了冯诺依曼和他的同事构想出一种计算机的架构——一个带有存储程序的计算机——这将对 Digital Light 的计算机产生重大影响。他们是在恶臭中从必要性中得出的,而图灵在象牙塔中是从理论中得出的。
和图灵一样,冯诺依曼也过着辉煌而短暂的一生。1957 年,53 岁的他被癌症带走,仅仅比图灵晚了三年,因此他也错过了新千年的数字大融合。然而,与图灵不同的是,他的政府在他的有生之年公开庆祝了他。艾森豪威尔总统于 1956 年向他颁发了总统自由勋章。他曾研究过原子弹和氢弹以及美国的洲际弹道导弹战略——他是一个鹰派,没有人怀疑他的忠诚。根据他自己的参议院委员会证词,他是“强烈的反共分子”。但具有讽刺意味的是,他的合作者克劳斯·富克斯将两人开发的秘密信息——一种点燃热核爆炸的方法——传递给了苏联。27
1937 年的某个时刻,冯·诺依曼、马克斯·纽曼和图灵都在普林斯顿——英美计算机事业的未来领袖。1938 年,冯·诺依曼几乎没有错过任何一个节拍,他试图将图灵招募到王子学院。令人惊讶的是,图灵拒绝了这个丰厚的提议。想想看。可能是冯·诺依曼和图灵走出了王子学院的起跑线。第一台计算机可能是美国的。28
然而,图灵和冯诺依曼的性格截然相反,以他们两人为主角的团队,极客和快乐生活,可能行不通。冯诺依曼一定已经感觉到他会成为图灵的头号狗。可能图灵也是。然而,这并不能说明问题,因为图灵忠于自己的性格,他自己出击了。他回到英格兰,几乎立即被招募到布莱切利公园。那是 1939 年,英格兰被吓坏了。
布莱切利公园是图灵著名的帮助破解德国人用于战争通信的加密方案的地方。他们使用了一种极其复杂的加密机器,名为 Enigma(它的实际商品名),类似于用木头包裹的老式黑色打字机。职员会在 Enigma 中输入一条短信——比如说从德国海军总部的一位海军上将到海上的一艘 U 型潜艇——机器会以一种方式对这些字母进行加密,然后以第二种方式对被加密的字母进行加密,依此类推。乱码有好几层,每一层都可以改变。U-boat 会像发送者一样配置其接收 Enigma。然后,收到的消息将按相反的顺序逐层解扰,直到原始消息被显示出来并为 U 艇船长输入。他们每天使用一次性垫系统重新配置机器的加扰。回想一下,Kotelnikov 和 Shannon 都证明了这样一个系统是牢不可破的——至少如果使用得当的话。但德国人认为该系统是牢不可破的,因为有很多配置是可能的。事实上,他们从来没有想到图灵和他在布莱切利公园的同事已经打破了它。Bletchley 利用了这样一个事实,即操作员并不总是正确使用该系统,但他们大多使用大量计算。这就是计算的用武之地。(Enigma 在 Bletchley 的小屋 8 中被破解,如图 3.7 中的照片 B 和 C 所示。照片 A 是奇怪的庄园。)但德国人认为该系统是牢不可破的,因为有很多配置是可能的。事实上,他们从来没有想到图灵和他在布莱切利公园的同事已经打破了它。Bletchley 利用了这样一个事实,即操作员并不总是正确使用该系统,但他们大多使用大量计算。这就是计算的用武之地。(Enigma 在 Bletchley 的小屋 8 中被破解,如图 3.7 中的照片 B 和 C 所示。照片 A 是奇怪的庄园。)但德国人认为该系统是牢不可破的,因为有很多配置是可能的。事实上,他们从来没有想到图灵和他在布莱切利公园的同事已经打破了它。Bletchley 利用了这样一个事实,即操作员并不总是正确使用该系统,但他们大多使用大量计算。这就是计算的用武之地。(Enigma 在 Bletchley 的小屋 8 中被破解,如图 3.7 中的照片 B 和 C 所示。照片 A 是奇怪的庄园。)
解扰 Enigma 代码的试错法是一项非常乏味的工作,最初是由人类手动完成的——由美国数百台计算机的手和大脑完成。人类女性变种,图灵的“奴隶”。为了帮助减轻单调乏味并提高解码速度,布莱切利公园的人建造了大型机器,称为 Bombes。它们还不是计算机,正如我们现在所说的那样,但它们肯定正在走向它们。它们不是可编程的,即使使用硬件切换和电缆,在该术语的任何一般含义中也是如此。从某种意义上说,Bombe 是一台图灵机,但不是通用的图灵机。它执行了一项包含许多步骤的系统任务——尝试了一个 Enigma 可能使用过的无数可能的加扰——但这是它唯一能做的计算。硬件炸弹的速度大大超过了有血有肉的计算机。例如,速度是至关重要的,它可以在 U 艇的路径上向美国和英国商船发送信息。所以推动了——进行计算快。
图 3.7
图灵需要一个合作伙伴,而不是领导者。他太孤独了。这就是马克斯·纽曼(Max Newman)——已经是他的导师和推动者——会再次想到的地方。和图灵一样,纽曼在普林斯顿逗留后回到了英国。与图灵不同的是,他有一个家庭——他的妻子林恩和他们年幼的儿子爱德华和威廉——并且需要保护他们。由于他是犹太人(顺便说一句,冯·诺依曼也是),他担心如果纳粹占领英格兰,他的家人会受到威胁。到 1940 年,他已将林恩和男孩们藏在遥远但熟悉的普林斯顿大学,他们将在那里呆了几年。与此同时,他加入了布莱切利公园。
图灵用炸弹领导了对 Enigma 加密机的第一波攻击。然后轮到纽曼了。他领导了第二波攻击,针对的是一种较新的德国加密机器——绰号 Tunny(英国的金枪鱼)。这次攻击使用了一台巨大的电子机器 Colossus,它最初是在 1943 年建造的。实际上,使用了十个这样的野兽。所有这些类似于计算机的计算机——它们不是存储程序计算机——在美国几乎计算机的 Eniac 之前都可以运行。29
图灵与 Tunny 及其 Colossi 有很大的间接关系。他提出了一种在布莱切利口中被称为图灵主义的数学见解,这是破解 Tunny 的关键。令人惊讶的是,考虑到他与纽曼的关系以及他自己与 Bombes 的布莱切利公园机器经验,他没有更直接的角色。但他和纽曼当时并没有合作——而且在一段时间内也不会合作——因为解码文本不再让图灵兴奋。他的新兴趣是对声音进行编码。英国政府将他送回美国执行一项特殊任务,从而激发了这种兴趣。30
图灵和科捷尔尼科夫于 1936 年在曼哈顿擦肩而过,从未见过面,但他们之间仍然存在令人惊讶的联系。它是声码器——“语音编码器”的缩写——而不是你想象的计算、采样或破译代码。声码器不仅将图灵与科捷利尼科夫纠缠在一起,还与香农甚至索尔仁尼琴纠缠在一起。他们都在声码器上工作。回想起来,与计算机相比,声码器似乎是微不足道的干扰。但在当时,它似乎是一项同样重要的技术。回想起来,我们也可以看到它为未来的光和声数字化进步埋下了种子。
回想一下第 2 章,Kotelnikov 和随后的 Shannon 证明一次性垫是牢不可破的。使用一次性填充码增强的声码器使口语与书面语一样安全。一个加密的声码器——一个语音加扰器——就像一个用于语音的 Enigma 机器。
斯大林变得越来越偏执,并要求使用语音扰频器来保护他的通信免受潜在间谍的侵害。这种需求将促使科捷利尼科夫和索尔仁尼琴一起在莫斯科北部的 Marfino sharashka。
丘吉尔和罗斯福(以及后来的杜鲁门)虽然不那么不理性,但也需要一个用于战时通信的语音扰频器——X 系统。这促使图灵和香农于 1943 年在贝尔实验室一起工作。英国政府任命图灵为其专家,以验证 X 系统的安全性。这就是为什么他没有在布莱切利公园与纽曼合作。相反,他与美国政府承担相同任务的专家香农短暂会合。出于安全原因,两人不能提及密码学,但他们可以谈论关于计算、计算机国际象棋和计算机作为人类智能模型的一切。31
如此多的像素英雄设计了声码器这一事实是了不起的,但该设备与我们的计算故事真正相关的是图灵自己制作了一个。在他的密友罗宾甘迪的建议下,他称它为“大利拉”——意为“男人的骗子”,暗指参孙的圣经情人和背叛者。设计大利拉让他获得了他所缺乏的动手工程经验。Delilah 不是计算机,但经验让图灵设计出了一台真正的通用图灵机。这是从塔楼到臭气熏天的准备工作。32
有充分的理由进一步研究声码器。这是前两章中频率和采样思想的一个很好的例子。
首先我们使用傅里叶的频率思想。我们将声音使用的频带分成十个更小的频带。假设人声的频率假设为每秒 0 到 3,000 个周期。(语音通信通常不使用人类听觉能力的全部范围,它可以达到每秒 20,000 个周期。)将此频带视为分为十个带宽频带,每个频带每秒 300 个周期。例如,原始语音消息中小于每秒 300 个周期的所有频率都在频段 1 中,每秒 300 到 600 个周期之间的所有频率都在频段 2 中,依此类推。语音加扰器的粗略想法是以一种已知但秘密的方式对这十个频段进行加扰,传输结果,然后在接收端进行解扰。
现在我们调用采样定理以适当的采样率用十组样本来表示十个波段中的每一个。实际上被加扰然后传输的是这十组样本。如果一次性填充系统用于额外的安全性,那么它的贡献会在加扰步骤之前添加到每个通道中的样本中。在接收端,频段的解扰发生,并且如果使用一次性填充代码,则减去。根据采样定理重构十组频率分量,然后将它们全部加在一起以获得原始语音消息。
令人惊讶的是,采样定理被完全使用了。回想一下,那是 1943 年,香农直到 1948 年才出版他的版本。显然,在香农出版五年前,西方完全理解了抽样。采样在俄罗斯被用于他们的声码器也就不足为奇了,因为 Kotelnikov 于 1933 年在那里发表了它。此外,图灵在不久之后在他自己的声码器 Delilah 的设计中使用了采样。他报告说,他在 1943 年第二次从美国回国的船上构思了他的声码器版本。
声码器仍在我们身边,但现在内置了一台计算机。在现代主流音乐中,增强声码器的商标名为 Auto-Tune。今天它是关于语音增强,而不是加密。使用它的音乐家——例如雪儿、劳里·安德森和 T-Pain——是图灵、科捷利尼科夫、香农和索尔仁尼琴的遥远概念表亲和奇怪的伙伴。Auto-Tune 是“人声的 Photoshop”,因为它使许多歌手——不如刚才提到的三位歌手——变得完美。Photoshop 参考提醒我们,像素和索素是同一个想法——我们可以用计算机和光从头开始创建声音模式。
大多数人认为计算机无法理解,但实际上它们非常简单。您已经体验过名片设备,并使用它进行计算。它只有四个状态和六个符号,而且是纸做的。然而,它可以计算任何可计算的东西。它是一台计算机。
但是计算机确实必须进行编程。正如您可能怀疑的那样,这是棘手的部分,它可能非常乏味且容易出错。甚至图灵本人也在他的程序中犯了错误。但那是软件,不是硬件。硬件在概念上很简单,并且可以与软件分离。
了解硬件并不能告诉我们软件。我们可以知道计算机硬件的完整接线图,而无需了解它在计算什么。例如,您现在完全了解名片“硬件”的工作原理。然而,基于这种理解,你不知道它的任何一个软件程序意味着什么。您可以了解施坦威三角钢琴的工作原理,但如果没有乐谱——它的音乐软件,就无法从中演绎出肖邦练习曲。肯定也是确实,您可以在不知道人脑在想什么的情况下知道人脑的完整接线图。
这就是最初激发图灵的难题——eProblem,Hilbert 的 Entscheidungsproblem——发挥作用的地方。需要明确的是,我们在这里主要关心的不是难题——而是计算机,图灵用来解决它的机器。但重要的是要提醒自己,计算的根源有一些深刻的东西。值得提醒的是,很少有人意识到这一点,因此对计算机是什么有错误的直觉。
许多人认为计算机是一台完全确定的机器。这是完全正确的,因为计算机采取的每一步都是完全定义的。例如,名片机的每一步都是由其24条规则的指令表、当前扫描的符号和卡片的当前方向决定的。但是得出的推论——计算机所做的事情因此是完全预先确定的——是错误的。机器的命运是完全确定的,但你不能总是知道那个命运是什么。如果你不能提前知道,那么确定是什么意思?
要根据机器定义确定,请再次回忆那些多步骤的过程,包括它们的所有循环和分支以及随之而来的自我参考。它们是一种不同的数学动物。毕竟,计算机很困难这种模糊的感觉是有原因的。但这不是因为硬件。这是关于硬件和软件以及一个运行另一个的方式的东西。
请记住,图灵对 eProblem 的解决方案是没有解决方案:简单一阶逻辑中的陈述是真还是假是不可判定的。您当然可以在某些情况下做出决定,但不是全部。没有算法。计算中有一个类似的结果——某种不可知性或不可解性——称为停止问题:一般来说,你甚至无法知道计算是否会停止这样简单的事情!没有系统的测试来决定它是否最终会停止。给定程序及其输入数据,没有任何算法可以发现程序最终会停止还是永远运行。33
换句话说,没有用于停止的 DNA 测试。您必须运行该程序才能看到它的作用。也就是说,你必须找到计算机操作从开始到结束的路径——如果有的话。如果它停止了,那么你知道答案,但如果它没有停止,那么你还不知道。如果你让程序运行的时间长一点呢?你可能正在追逐野鹅。它可能处于无限循环中。一般情况下你无法知道。
所以一台计算机是完全确定在小而在大不可知的。在正常实践中,这种奇怪的行为并不是真正的问题。程序员通常对他们的程序将要做什么有一个很好的想法——只要它正常工作,就是这样。所以在数字光中,不可知主要是理论上的问题。程序员尽量不写不可知的代码。几十年来,许多编程学科已经发展,以帮助他们避免未知的陷阱。
其中一个陷阱是图灵最感兴趣的计算方面的结果:计算在计算时实际改变自身的能力。例如: (1)从输入数y中减去输入数x。(2) 如果结果是否定的,则将步骤 3 中的步骤编号更改为 4,否则将其更改为 5。 (3) 转到步骤 4。 (4) 写入“减号”并停止。(5) 写“加”并停止。
让我们尝试将数字 7 分配给x并将 6 分配给y: (1) 7 减去 6 等于 1。 (2) 结果为正,所以: (3) 转到步骤 5。 (5) 写“加号”并停下来。一个程序不仅可以是一个令人讨厌的分支和循环的缠结,而且它可以是一个移动的目标。大多数现代操作系统通过禁止这种自修改代码来“保护”程序员——就像自锁车门一样。它太容易造成破坏。然而,图灵实际上将这个想法带入了真正的计算机世界。当他有机会为实际硬件设计一个条件分支指令时,他的条件分支指令是通过自修改代码实现的。34
当您将计算视为人类大脑或思维的模型时,了解这种不可知性是很有用的——就像图灵、冯诺依曼和香农所做的那样。计算结果可能不是一个好的模型,但不能因为声称它是确定性的,因此是预先确定的而立即将其驳回——也就是说,它在某种程度上过于僵化和受限制,不值得我们使用。你只需要让它运行看看它做了什么。
为数字计算机准备程序的过程特别有吸引力,因为它不仅可以在经济和科学上获得回报,而且还可以是一种审美体验,就像创作诗歌或音乐一样。
—Donald E. Knuth,计算机编程的艺术35
编程是计算的秘密,但科学家们至少花了十年时间才意识到这一点。图灵在他 1936 年的著名论文《论可计算数》中展示了第一个程序。他为引入计算的概念机器(图灵机)编写了它们。所以他发明了编程和存储程序的概念。他给了我们计算这个词,但没有给我们编程这个词。这个词是从哪里来的?图灵使用指令表准备来指代编程。
让我们更仔细地看看图灵实际上做了什么。假设他想要一台可以反转输入磁带上任何字符串的机器。他设计了一套规则——指令表——用于实现字母系统反转的特定图灵机。称它为 A。然后他会将 A 的规则交给一台通用计算机。回想一下在其磁带上显示任意机器 A 和在其磁带上显示通用机器 U 的图片。图中的“A 的编码规则”就是我们现在所说的A程序。聪明而有趣的部分是为 A 设计指令表,而不是将其编码为 U 所需的形式。编码很简单,而且,机械的。在我们的名片机示例中,用 0 代替空白,用 f 代替正面方向,等等。很蠢的东西。机器不会觉得无聊,但人类会。
将编程分为创意部分和无聊部分仍然存在。在钢琴的隐喻中,乐曲的组成是创造性的部分,而将其编码为音符和乐谱上的休止符是无聊的部分。现代计算机的一个主要用途是为计算执行无聊的编码步骤。它称为汇编或编译。程序员在高符号级别(使用类似英语的语言)工作以创建程序,这是有趣的部分。然后计算机将程序编码成计算机实际理解的冗长乏味的长序列,几乎是微不足道的操作——顺便说一下,这是计算机的常见非数字使用的一个很好的例子。无论如何,这就是它现在的工作方式。
然而,在 1940 年代后期,那些准备制造第一台硬件计算机的人使用“设置”一词来描述您如何让机器计算您希望它计算的内容。在几乎是计算机的早期——例如,像 Eniac——这意味着实际插入电缆和切换开关,因为这是可以在硬件上安装程序的唯一方式。后来——正如对存储程序计算机的设想——“设置”似乎不仅意味着创建一个程序,而且确保它被加载到计算机内存中的正确位置。
起初,它就像是事后的想法——现在我们有了一台机器,让我们开始吧。那时,仅仅制造一台可以工作的计算机就几乎占用了工程师的所有创造性带宽。但他们很快发现“设置”是一项复杂、容易出错且繁重的活动。它变成了摇狗的尾巴。现在这似乎很明显,因为有些程序有数百名程序员编写的数百万个步骤。
但当时,他们需要一套技术来指导和简化“设置”任务,他们也需要一个更好的名称。Princetitute 的冯诺依曼档案中的文件记录了动词to program首次出现的那一刻。它既是编程这个词的诞生,也是编程艺术,一门新学科。36
在 1945 年 9 月 5 日的一份备忘录中,每个地方编程都是一个有用的术语,冯诺依曼改为使用“设置”,用占位符围绕它引号。他说:“我想再次强调这一点。. . 如此灵活且高度自动化的“设置”机器解决问题的系统对于人们应该考虑的科学用途来说是绝对必要的。” 他说,无论我们怎么称呼它,这都是绝对必要的。37
一封日期为 11 月 1 日的信在保护性引号内暂时建议了“设置”的替代方案:“我们计划的电子精密设备当然会在速度、灵活性(通用字符)和至少会像“设置”或“编程”一样容易。”也就是说,他说,它不能像 Eniac 那样是拨动开关和电缆。38
然后它发生了。仅仅几周后的 11 月 19 日,“设置”就再也没有出现过。它现在正在编程,没有带歉意的引号。第三份文件是在项目成员 Vladimir Zworykin 办公室举行的会议记录。“下表列出的代码只是为了证明可以完成这项工作。列出的操作足以完成编程。” 在这几分钟里,不仅编程,而且编码。39
冯诺依曼团队显然意味着编程是创造性的部分,而编码是无聊的部分,是一项“秘书任务”。今天的程序员称自己为编码员,他们编写代码。它们指的是创造性方面,无论是什么术语。他们明白,无聊的部分现在已归入机器本身。
所以在 1945 年末,冯·诺依曼团队,可能是冯·诺依曼本人,是第一个或多或少地按照我们今天的意思使用编程这个词的人。图灵很快也在 1947 年的一次演讲中使用了这个术语,但他在有限的上下文中只使用了几次。40
不管是什么术语,很早就清楚地表明,编程,创造性的方面,是计算的困难部分,并且必须发展它的一门学科。世界各地的计算机科学系都从这种认识中脱颖而出。
编程是制作代表虚构世界的像素的方法。它将 Digital Light 从仅仅拍摄照片扩展到制作它们——从仅仅拍摄它们到计算它们。
[它] 变成了一台迷人的织布机,数以百万计的闪烁的梭织出一个消融的图案,永远是一个有意义的图案,但从来没有一个持久的图案;子模式的变化和谐。
——查尔斯·谢灵顿爵士,《人的本性》41
下一章是关于将计算概念转化为实际实践——第一台机器的竞赛。在我们到达那里之前,让我们消除关于计算机的三个神话:它们不一定是电子的,它们不一定是由比特组成的,它们不是基于数字的——甚至不是 0 和 1。
首先,计算机不必看起来像您通常知道的任何东西:您的手机、笔记本电脑、台式机、大公司的巨型主机或高科技研究机构的超级计算机。名片设备就是一个很好的反例。它是一台计算机,为了满足我在本书中的目的,它被实现为纸上墨水、硬卡片纸和薄金属。这显然不是电子的。
一个流行的教学技巧是让教室里的学生变成一台计算机。让我们把这个想法提升一个档次。假设我们让美国所有 12 岁以上的人排成一排。那条线将成为我们计算机的磁带——它的内存。如果我们需要更多记忆,我们会招募一些加拿大人和墨西哥人。假设每个人有五顶不同颜色的帽子。这五顶彩色帽子将成为我们磁带上的符号。第六个符号将是没有帽子,这将是除了少数人之外的所有人的默认条件。我们将选择一个人作为磁带的扫描仪。当我第一次设计这个例子时,巴拉克奥巴马是总统,所以我们会让他成为我们的磁带扫描仪,让他从磁带正方形的职责中解脱出来。他随身带着名片机的 24 条规则——它的指令集——用五种颜色而不是数字 1 到 5 表示(空白没有帽子)。规矩照常分为四组规矩,每组规矩都在他的一个口袋里,两个在前面,两个在后面。所以他的口袋是四个状态。
奥巴马从一个戴红帽子的人开始,然后应用一套装在口袋里的规则——比如说他右前口袋里的规则。如果奥巴马右前口袋里的红帽规则规定,被称呼的人会将帽子换成另一种颜色,或者完全摘下帽子。然后奥巴马根据相同的规则向左或向右移动一个人。然后,如果当前规则指示他,他会为下一条规则更换口袋。等等。那是一台由人类组成的计算机,带有用于状态的口袋和用于符号的帽子。它可以计算任何东西,因为它与名片机、通用计算机做同样的事情。这只是同一台机器的不同硬件实现。但它是一台真正的计算机——当然不是电子的(或数字的)。
名片计算机,或者它的人类等价物,也是我们第二个被揭穿的关于计算机的信念的反例——它们必须由比特组成。回想一下第 2 章,一个位有两种状态,就像一个可以向上或向下的电灯开关。但是名片机有四种状态,或者说方向。每个磁带方块可以包含六个值或符号。名片机中没有一个只有两个值的部分。它不是由比特组成的。也不是人类的等价物。
位不是必需的,但工程师很快发现它们在实践中非常方便。事实上,他们在计算机设计中使用了多年正式将图灵的伟大想法转化为比特。那个人就是克劳德·香农。也许是他 1943 年在曼哈顿与图灵的会面——他们表面上以声码器为导向的会议——引发了这种兴趣。香农表明,具有任意数量符号的图灵机可以被另一个只有两个符号的图灵机替换,并且将计算相同的东西。由于图灵机的磁带是它的内存,香农的等效图灵机中的磁带方块是一个内存位,两个符号作为值。42
第三个神话更有害。相信位的两个值必须是 0 和 1。换句话说,第三个神话是计算机是由 0 和 1 构成的,因此计算机从根本上讲是关于数字的。这个神话将计算器(一种用于数字运算的机器)与计算机混为一谈,这是一个更大的想法。它还将字形(名称)的概念与其可能表示的内容(即,与命名的内容)混为一谈。
这种误解是很自然的,源于我们通常为比特的两种状态选择名称。我们方便地称它们为 0 和 1。但我们可以称它们为昼夜、向下和向上、点和破折号,或者 ooh 和 aah。我想你会同意这些名称不如 0 和 1 方便或简洁。但是,与名片机一样,它们只是名称而不是数字。
很容易理解为什么计算会与数字混淆。图灵的原始论文的标题是“关于可计算数”。Eniac 中的“n”代表“数字”。算法一词向早期的算术致敬。当时在非常慢的机器上进行的许多原始计算都是数字化的——例如早期的氢弹计算。数字是新的计算工具最容易攻击的第一个符号。一些早期的实践者自己似乎从来没有理解计算机不仅仅是一个快速的数字运算器——一个计算器——但图灵知道计算机还能做多少。事实上,有趣的是,布莱切利公园的图灵炸弹和纽曼巨像并没有计算或操纵数字,而是使用符号替换来破解密码。43
本节题词的作者查尔斯·谢灵顿爵士使用他著名的“魔法织机”比喻来描述人类大脑的清醒皮层,但它也适合现代计算机的工作原理。这是关于改变模式。这与数字无关,除非我们赋予模式的意义是数字。但这只是我们可以对这些模式做出的无数解释之一。对计算机来说,它只是模式。
如果计算机中没有数字,那还有什么?今天世界上几乎所有的计算机都是电子的并且是由比特构成的。它们是由计算机芯片制成的,这也许是我们最伟大的技术成就。如果你能在这样的芯片内部看一下,你会发现高电压和低电压的模式。那些是位。
一个您可以看到且具有相似模式的熟悉的地方——好吧,无论如何都要测量——是你家中的电源插座。我们知道那里的交流电压以傅里叶波的形式从最大电压波峰变化到最小电压波谷每秒 60 个周期(美国)。通过您的插头进入您的计算机实际上是一个不断变化的波,从低电压到高电压再返回。
但是在芯片中,电压不会像在交流电源插座上那样平稳且不间断地变化。它保持其值(例如,高),直到计算机规则指示它更改为另一个值(低)。每个芯片位置都可以采用高电压或低电压——并在控制下切换到另一个——实现了位的抽象概念。我们所说的是,在指示更改为 0 之前,位是 1。看看这些名称有多方便!但物理现实是电压——就像交流电源插座上的现实——而不是数字。
如果您考虑一台内置数万亿位的计算机,通常以常规数组的形式,那么您就会明白为什么 Sherrington 的比喻有效。当它以当今计算机的惊人速度运行时,数以万亿计的电压模式在每秒变化数十亿次的电子舞蹈中扭曲和编织。有时他们用整块布编织电影。
Digital Light 的秘密不在于您可以通过某种方式将图片转化为数字,就像旧的“数字绘画”涂色书一样。就是我们每天看到的视觉模式,明暗和运动的模式,可以用机器中的电压模式来表示。我们用计算机的模式模仿世界的模式。
对于 Bletchley Park 的密码学家和数学家小组来说,文本是加密的德国战争信息。对于伦敦著名的布卢姆斯伯里作家和思想家群体来说,这是高级英国文学。乍一看,布莱切利和布卢姆斯伯里似乎没有什么共同之处。但这两个圈子在 1940 年代和 1950 年代以松散但奇怪的方式相互交织在一起。
这并不意外,因为英国知识分子,无论是数学还是文学,都倾向于通过剑桥或牛津进行筛选。例如,小说家 EM Forster、出版商伦纳德·伍尔夫和经济学家约翰·梅纳德·凯恩斯都是著名的布卢姆斯伯里成员。他们都属于剑桥的秘密社团使徒,其中包括艾伦·图灵的合作者罗宾·甘迪和大卫·尚佩诺恩。
然而,这是巧合。离它不远的是通过 Stracheys 的家庭联系。Bloomsbury 的 Lytton Strachey 有一个兄弟 Oliver,他是 Bletchley Park 的密码学家,还有一个侄子 Christopher,Oliver 的儿子,他是 Turing 在剑桥的同学。克里斯托弗·斯特拉奇(Christopher Strachey)在下一章中作为第一个有记录的电子游戏的作者而引人注目。
但真正有意义的联系将布卢姆斯伯里的福斯特与图灵联系在一起。福斯特的小说莫里斯敢于传达——仅在手稿中——成为“奥斯卡王尔德那种难以言喻的人”的感觉。据他的传记作者说,图灵在这本书中得到了安慰。44
也许最有趣的领带关系到另一位布鲁姆斯伯里巨人弗吉尼亚·伍尔夫,她的丈夫伦纳德也是她的出版商。弗吉尼亚以保存大量日记而闻名,因此伦纳德的故事编辑之一林恩·欧文的名字出现在其中也就不足为奇了。出人意料的转折是林恩嫁给了图灵的导师和布莱切利公园的贡献者非文学作品马克斯纽曼。45
在战争期间担心他们的半犹太人儿子,林恩与新泽西州普林斯顿的男孩们一起流亡。马克斯从战前与图灵一起度过的那段时间就知道该地区。但这一次他留在了英格兰,只留下林恩和孩子们在一起。在一次国事访问中,约翰梅纳德凯恩斯在华盛顿与罗斯福总统呆了几个小时后,在普林斯顿对她进行了搜查。他的举动让她耳目一新,让她想起了伦敦,也让她从智力孤立中解脱出来。
林恩和马克斯的小儿子威廉记得这次访问。凯恩斯陪年轻的威廉去理发店理发,让他坐在冯诺依曼旁边。但有些事情让男孩心烦意乱,他哭着逃走了。凯恩斯在冯诺依曼刮胡子的时候,用银色的舌头追着并哄着他回到椅子上理发。46
林恩与图灵的友谊后来开始了,当时两人都回到了英国并住在曼彻斯特。仍然渴望伦敦的文学界,她发现他与马克斯的其他主要谈论数学的来访者不同,令人耳目一新。她认为他是一个“非常简单、谦逊、温和的人”。我们期待她对圣图灵有更深入的了解。
虽然在她眼中算不上极客,但她确实在印刷品上触及了图灵的极客特征。她在萨拉·图灵关于她儿子的传记的前言中写道:“他的衣服从来都不好看。” 并且,“他有一种奇怪的不让人看到眼睛的方式。”
林恩在被捕后与图灵变得特别亲近,除了官方机密外,他再也没有什么可隐瞒的了。在最后的日子里,他对她说:“我简直不敢相信和一个女孩上床就像和一个男孩上床一样好。”
“我完全同意你的看法,”林回答道。“我也更喜欢男孩。”
他们之间产生了一种与怪胎不相称的亲密关系。现在,他的眼睛不再是“一种不符合眼睛的奇怪方式”,而是“蓝色到彩色玻璃的亮度和丰富性,”她写道。“但一旦他以亲切交谈的自信,直接而认真地看着他的同伴,他的眼睛就再也不能错过了。这样的坦率和理解,从他们身上看,是一种文明到让人几乎不敢呼吸的东西。” 像图灵的母亲一样,林恩从不相信他是自杀的。47
但林恩对 Digital Light 的持久贡献是她的儿子。威廉纽曼将合着第一本计算机图形学教科书。
当我们准备开始第 4 章关于数字光的诞生以及它如何与计算机的诞生交织在一起时,这里是对第 3 章的快速回顾。我通过在小范围内强调其无意识的简单性,在直观的概念层面上介绍了计算并比较其令人敬畏的延展性和理论上的奥秘——它的不可知性——在大范围内。我建议编程是创造力和困难所在。我将计算确立为操纵符号模式的系统或算法过程。这些过程是通过非常简单的单个步骤来实现的——但其中有很多。我打消了我们认为数字是计算的基础的观念——计算机中没有 0 和 1——并且确定性在某种程度上限制了这个想法。我展示了计算不需要速度、比特和电子设备。
然而,下一章是关于速度、比特和电子学的。速度在现实世界中非常重要,而位和电子设备是实现它的关键。意想不到的礼物是令人敬畏的放大及其数量级的奥秘,计算进入超新星并发出数字光。
我对计算机不是很感兴趣,我做了一个,我认为一比一是一个很好的分数,所以我没有再做任何事情。
——弗雷德里克·“弗雷迪”·威廉姆斯爵士1
我问 Kilburn 教授,为什么每次我打开一本计算机科学教科书我都会看到计算机起源于美国,而英国人却一无所获?于是汤姆 [基尔伯恩] 从嘴里拿出烟斗说:“那些需要知道的人都知道。”
——Simon Lavington,英国计算机历史学家2
当我开始写这本书时,我和我的大多数同事一样认为,第一张电脑图片是在 60 年代创作的,尤其是由 Ivan Sutherland 和他在犹他州的团队创作的。但是当我试图确定日期时,我很快意识到没有人确切知道第一张数码照片是什么时候出现的。本章是我寻找它们的结果。在剑桥、牛津、曼彻斯特和波士顿的晦涩档案中呆了很多天后,我终于可以准确而完整地讲述这个故事了。
答案是一个巨大的惊喜:第一个像素出现在第一台计算机上。英国工程师 Freddie Williams(图 4.1,左)和 Tom Kilburn(右)创造了它们,加上第一个有效的计算机内存系统,击败了理论重量级人物图灵和冯诺依曼。英国工程师——精明的直言不讳,眼中带着一丝乐趣——肯定会对如此宏大的描述嗤之以鼻,尽管他们私下同意他们的看法。因为这一切都是真的。他们于 1948 年在英国曼彻斯特诞生并养育了那台计算机——令人愉快的名字 Baby。这是图灵 1936 年伟大构想的全电子硬件实现——存储程序通用计算机。这正是我们今天所说的计算机的意思。
争夺第一台计算机的竞争非常激烈。根据上面的描述,英国人赢了,但洋基队紧随其后。新发现的令人兴奋的记录表明这场比赛比以前知道的更接近——几天之内——而且洋基队甚至可能首先到达那里。让我们称之为领带。我们稍后会讨论这种发展。但我们的主要任务是数码光——那些没有争议的第一个像素。
图 4.1
Yank von Neumann 和 Turing 本人一样了解英国人图灵的伟大计算理念,两位天才都尝试了它的硬件版本。但是图灵陷入了官僚内讧,这是他最大也是唯一的失败——除非你算上个人的生存。冯诺依曼的团队未能及时获得威廉姆斯和基尔伯恩品种的电子记忆。他们,以及大约十几个其他美国早期的努力,采用了威廉姆斯和基尔本的记忆。
毫无疑问,威廉姆斯和基尔本创造了第一台数码灯。Baby的记忆片段是阴极射线管(CRT)表面的光点。每个点可以有两种尺寸,方便地称为 0 和 1。但由于这些位在 CRT 上是可见的,并且由于它们以整齐的行和列排列在那里,所以它们加倍作为第一个像素。
威廉姆斯给了我们第一个显示的像素。然后,Kilburn 在 1947 年从这些散布像素的阵列中创建了第一张数字图片,时间稍早于 Baby 完成——可以说是在子宫内。对我们来说幸运的是,他拍下了这一重大事件的照片(图 4.2)。我称之为显示First Light。这张不起眼的照片是数码光的开端,是黎明的曙光。这是整个现代图像世界的开始——一个没有像素无法想象的世界。重要的是,这是一个有意的二维图片,而不是任意不连贯的点阵列。
图 4.2
汤姆·基尔本,《第一道曙光》,1947 年。
因为在计算机的早期,制作图片被认为是轻浮的,所以历史学家几乎没有提到它们。Digital Light 是早期计算机故事中被忽视的一部分,因此 First Light 一直是不可见的和无法识别的。
故事从图灵的伟大想法开始。他为我们带来了延展性,这是计算的第一个奇迹——一种控制和执行无限复杂过程的方法。但他没有给我们速度。起初计算速度非常缓慢——回想一下名片计算机。图灵和冯诺依曼意识到,要让软件快速运行,他们必须将其转换为硬件。将图灵的软思想实现为硬件,即计算机,是加快计算速度的关键。放大——计算的第二个奇迹——需要它。计算机以两个容易标记的步骤到达。
我将第一步,即 1948 年至 1965 年称为 Epoch 1。这是一个巨大的恐龙机器时代——以房间甚至英亩来衡量——但并不是那么聪明。他们是沉重的,受到小记忆的限制。房间大小的 Baby 起初只有 1000 位——在今天的测量中是 128 字节。但 Baby 标志着硬件辅助计算时代的开始,第一次加速和 Amplification 的开始。
本章标题中的Quickening指的是婴儿和一般计算机的概念。但更重要的是,它也意味着加速。Baby 的计算机使计算速度更快。那是,现在也是,他们的目的。
Epoch 2 始于 1965 年,目前正在进行中。尽管计算机在 Epoch 1 期间速度有所提高,但直到 1965 年才出现了一种特别有效的加速,即第二次加速。当前的超新星时代由此而来,随着物理尺寸的急剧缩小,计算机能力呈指数级增长。摩尔定律抓住了它的本质:计算机的所有优点每五年就会提高一个数量级. 这个惊人的声明是如此具有革命性,以至于我们很难理解。它告诉我们,计算机在短短五年内提高了 10 倍——此后每五年这样做一次。例如,一辆 1965 年时速为 60 英里/小时的汽车,按照摩尔定律衡量,在 1970 年和 1975 年时速为 600 英里/小时,而价格不会上涨。对于汽车来说是不可想象的,但对于计算机来说却是这样。名副其实的奇迹。摩尔定律的硬件奇迹直接催生了Amplification的生产力奇迹。放大实现了大数字融合并创造了现代世界。
这是一场古老的比赛——至少自美国独立战争以来。刻板印象维持它:美国佬夸大其词,而英国人则轻描淡写。或者更糟糕的是:美国佬使用美元,而英国人使用大脑。英国间谍小说家约翰·勒卡雷 (John le Carré) 曾将美国人称为表兄弟,而他并不是指接吻类。表兄弟是反对希特勒和冷战的盟友,但合作往往不情愿。两支队伍在争夺第一台计算机的过程中既竞争又合作。这是一场势均力敌的比赛——如此之近,以至于一些历史学家仍在争论。
在 1960 年代,我这一代人被教导说,1945 年出生在费城的 Eniac——一台由 Yanks(我们)制造的机器——是第一台电子计算机。但它不是——不是按照今天计算机作为电子存储程序机器的含义。它甚至不是第一台几乎计算机。英国人(他们)已经赢得了那轮比赛,但我们洋基队却不知道。有那个官方保密法——图灵的暴君——又上场了。英国人在洋基队甚至没有意识到的情况下赢得了第一次小规模冲突。
在发表不知情或不准确的声明时,英国人也不是无可指责的。他们声称 1944 年初在布莱切利公园的机器 Colossus 是第一台电子计算机。那也是错误的。Colossus 和 Eniac 一样,使用的是硬件程序,而不是软件。两者都很大,都是电子的,但它们不是存储程序的计算机。重新编程这两种野兽都需要切换开关和重新插入电缆——以人类的速度手动重新布线机器硬件。图灵存储程序计算机思想的美妙之处在于程序本身可以存储在保存其数据的同一内存中。更改程序及其操作的数据是相同的过程。如果计算机是电子的,那么改变程序的速度就会以电子速度发生,这会让人类望而却步。3
但那些房间大小的庞然大物为表兄弟们服务得很好。几乎是计算机在军事上增强了洋基人和英国人。Eniac 进行了氢弹计算。Colossus 帮助破解了德国的加密方案,并确保诺曼底登陆成功。对于将着手设计和制造真正的计算机的工程师来说,这些机器是非凡的电子训练场——或至少是灵感。那些真正的计算机将由存储在计算机中的软件程序驱动,就像数据一样,而不是由电缆从外部强加。4
弗雷迪·威廉姆斯于 1946 年 12 月搬到曼彻斯特大学。他的第一个目标不是制造一台计算机,而是一台快速的内存。他在战时雷达方面的经验——在屏幕上显示光点——激发了他的想法,即最好的解决方案可能在于阴极射线管。1946 年,他在纽约贝尔实验室看到了一种很有前途的雷达技术。5
就在他搬到曼彻斯特之前,威廉姆斯成功地在 CRT 上存储了一个位。换句话说,他设计了一种方法,可以在管子扁平端的屏幕上的某个位置显示一个小斑点(一个点)或一个大斑点(一个破折号)。他可以写一点。此外,他(嗯,他的电子电路)可以查看已经存储在管表面上的斑点,并确定它是大还是小——他可以读取存储在那里的一点。他也可以将一个大斑点变成一个小斑点,反之亦然。用方便的现代术语来说,他可以将 0 或 1 任意写入一个位置,并且他可以读取那里存储的内容。最重要的是,他写到一个位置的值一直存在,直到他或计算机明确更改它。换句话说,它被记住了。瞧!1946 年,威廉姆斯创造了第一个可见的计算机位。6
他正在着手创造所谓的威廉姆斯管。它应该被称为 Williams-Kilburn 管——但几乎从来没有——因为 Tom Kilburn 很快就在曼彻斯特加入了威廉姆斯,并且到 1947 年 3 月已经积极参与管设计。到年底,Kilburn 能够以矩形阵列的形式在管表面存储 1,024 位,并创建并拍摄了 First Light 的照片,这是第一个数字光显示器(图 4.2)。然后他很快就提高到 2,048 位,创建了另一张照片,并拍摄了照片(图 4.3)。但是这个词还不存在,正如我们从第 3 章中知道的那样,所以他使用了digit反而。他写了一篇报告,他的博士论文,“用于二进制数字计算机的存储系统”,发表于 1947 年 12 月 1 日。他 26 岁。那是那个时刻。
基尔本 1947 年的报告用两张照片公开宣布了数码光的曙光。它们不仅仅是任何一系列景点的照片。它们是两张以数字方式渲染并存储在电子数字存储器中的图片。Kilburn打算将它们做成二维图片。
Kilburn 通过手工为 1,024 个光点中的每一个进行照明的“过于费力”的方法,创作了第一张数码照片 First Light。显示器是一个由 32 x 32 扩展像素组成的阵列。他使用“以打字机的形式排列”的 32 个键来切换位。Kilburn 将显示器描述为一组“图片元素”。正如我们所见,短格式像素还不存在——直到 1965 年。他将显示元素(可见)与图片元素(不可见)混淆了。我们在 Kotelnikov 章节中讨论了这种区别,但对于 Kilburn 来说还没有这种区别。7
Kilburn 使用同样繁琐的类似打字机的方法在 2,048 位内存中创建了第二张数字图片。这些图片中的每个散布像素都有两种状态,破折号(大斑点)和点(小斑点),方便地称为 1 和 0。这里的散布像素是圆形飞溅或斑点,具有两种不同大小的光。即使在最早的日子里,也没有小广场。
Kilburn 的目的——在他的报告和标题中明确说明——是为计算机设计内存。他在报告中描述了这样一台假设的计算机。然后他和威廉姆斯立即着手建造一台真正的计算机,并在半年内交付了著名的婴儿。8
在图 4.4 中,清醒的、适当奖励的 Kilburn 是皇家学会会员,他拿着他的名声标志,一个 Williams 管——一个 Williams-Kilburn 管,确切地说是笨拙的——而 Baby 则在背景中徘徊。威廉姆斯和基尔本在他们的一生中都获得了巨大的荣誉。到 1977 年弗雷迪·威廉姆斯去世时,他已经是弗雷德里克爵士,也是皇家学会会员。基尔本于 2001 年去世一年后加利福尼亚的计算机历史博物馆让他成为研究员,这是新千年的合适开始。
图 4.3
图 4.4
但没有证据表明 Kilburn 曾经了解计算机上的第一张照片 First Light 的重要性。据我们所知,他在 1947 年创作了前两张照片后,就再也没有创作过另一张照片。事实上,也没有其他人在 Baby 上拍过照片。人们似乎觉得,拍照并不是对计算机的认真使用。这是亵渎神明的。那是禁果——虽然不完全是雕刻的图像。战争刚刚结束,计算资源稀缺,对它们的需求非常强烈。与 Williams 和 Kilburn 合作开发 Baby 的 David “Dai” Edwards 表示,当时用户对这款机器“绝望”。团队的另一名成员 Geoff Tootill 表示,当时团队仍然在战时精神下运作,没有时间放松。9
拍照对他们来说是一种轻松、愉快的活动。一张图片作为记忆测试模式是一回事,否则为了这种轻浮和世俗的追求而浪费宝贝稀有的计算资源就完全是另一回事了。相反,机器应该计算一些“严肃”的东西。
从角度来看,考虑几十年后完全不同的环境,即 1998 年,婴儿的精确复制品是为 50 周年而建造的。庆祝活动的编程竞赛引发了几个 Baby 程序,这些程序在 Baby 的显示器上创建了图片,甚至是动画图片。一生成词BABY。
婴儿重建由克里斯·伯顿在曼彻斯特带头。2013 年 7 月 4 日,他安排我去曼彻斯特科学与工业博物馆看 Baby。BabyPIXAR滚动显示器(图 4.5)——一个电脑动画来欢迎我!我的主持人 Brian Mulholland 前一天为它编写了 Baby 程序。但它本可以在 1948 年在 Baby 身上运行。10
对于那些安于和平时期、充斥着计算资源并且更熟悉计算机作为图片制作者而不是数字处理器的现代程序员来说,图片创作是显而易见的——甚至是不可抗拒的。没有视觉显示、动画和交互的计算机现在几乎闻所未闻。我们称它们为服务器。
梳理计算机的早期历史仍然不容易。即使是曼彻斯特婴儿的单一故事也很复杂。完整的历史将有太多人、机器和国家——以及太多的细微差别——不能舒适地放在一本书中,更不用说一章了。我仔细定义了我们所说的计算机的含义,并只关注那些导致数字光的途径,从而修剪掉了大部分的灌木丛。这使得早期计算机历史的一个非常强大的部分完好无损。
图 4.5
然而,那个较小的部分仍然有数十名玩家。为了提供结构,我继续将他们分成两支球队——英国队和洋基队——并假设他们之间有一场戏剧性的比赛。这是一部奥林匹克小说。参赛者不再是国家队,也不是奥运代表队——只受他们挥舞的旗帜和奖牌数量的约束。然而,该设备组织和跟踪复杂的奥运会,它也适用于计算机历史。竞争背后也有一些真相。
计算机早期历史的“流程图”(图 4.6)给予硬件和软件贡献者同等的赞誉。计算机几乎从未出现过这种情况——这反映了永无止境的高塔与臭气熏天的战斗。这里的软件被概括为包括所有仅是精神上的工作。
同时也是著名理论家的软件贡献者——特别是图灵和冯诺依曼——经常被授予荣誉,但事实并非如此。Baby 的硬件“母亲”Williams 和 Kilburn(实线)对 Baby 本身来说比其早期的程序员 Turing 和 Newman(虚线)更重要。
流程图也让各个参与者之间的相互联系更加明显。人用圆圈表示,计算机用矩形表示,概念用平行四边形表示。图表中没有可行的直线叙述路径。但它是有根的。最重要和最中心的是图灵 1936 年的“论可计算数”,该概念文件以计算的定义和对存储程序计算机的详细描述开始了这一切。从中流出了冯诺依曼 1945 年的Edvac 报告和图灵 1946 年的Ace 报告,其中描述了实际计算机的两种不同架构。
编程是最著名的软件形式。计算的数学是另一回事,如“论可计算数”。第三种脑力劳动以 Edvac 和 Ace 报告为代表。因此,完全意义上的软件贡献包括存储程序计算机的概念、一个架构或它的程序。图表中 Edvac 报告的虚线显示了它对图表中几乎所有计算机的概念(软)贡献,除了图灵的直线。
同样,但在硬件方面,Williams 和 Kilburn 影响了两个团队的几台早期机器的设计。它们的设计(硬)贡献由流程图中每个的实线表示。他们不是任何其他非曼彻斯特计算机的工程师,但 Williams-Kilburn 管直接影响了这些计算机的设计。
想法之间
而现实
动作之间
和行为
落下阴影
——TS艾略特,“空心人” 11
听起来,计算机架构是一个计划。它与计算机设计明显不同。我将保留这个熟悉的词,以使架构存在于现实世界中,使用实际的电子设备。建筑是理念;设计就是现实。设计是一个硬件问题,至少需要与建筑一样多的创造力——有些人会说得更多。但这是一种不同的创造力。那是因为架构并不规定或指导设计。一所房子的建筑可以体现在许多设计中。一个标有厨房的盒子激发了——但绝不是指导——花岗岩、瓷砖、木材、把手、灯、水龙头、油漆、窗扇等的无数组合。
图 4.6
图 4.7
Edvac 报告中指定的著名架构——称为冯诺依曼架构——至少影响了流程图中显示的六种不同的计算机设计,甚至更多。图 4.7 显示了它的典型平面图。考虑标记为Memory的简单框。没有指定实际的内存技术——这是硬件设计问题。
设计人员必须拿出那个空盒子,并弄清楚如何在现实世界中制造一个能够正确地将那个盒子连接到计划中的其他空盒子的设备。然后他们必须掌握他们选择的物理特性,并使所有设备与一个真正的内存一起工作,该内存保存实际的比特,与自身外部的世界通信,并在给定的电网上工作。从建筑中的空盒子到设计的步骤是一个重要的创造性步骤。它没有算法。
尽管洋基队开发了获胜的建筑,但英国人创造了获胜的设计并因此赢得了比赛。那个盒子的设计,内存,是第一台计算机和数码照片竞争的关键因素。
冯诺依曼和图灵架构是等效的想法。两者都是实施图灵存储程序通用计算机概念的计划。图灵的架构也有一个存储盒,以及控制、算术、逻辑和输入输出盒。在这两种架构中,内存和输入输出都相当于通用图灵机的磁带,其余的盒子构成了它的扫描头。图灵在 1947 年的一次关于 Ace 的演讲中明确说明了这种联系。同样,尽管 Edvac 的报告并不明确,但冯诺依曼在 1943 年和 1944 年告诉人们图灵的根本重要性。12
一般的经验法则是,任何软件过程都可以通过在硬件中实现来加快速度。事实上,计算机本身就是图灵的软硬件实现,但速度非常慢,存储程序通用计算机的想法。算术和逻辑可以是软件,但冯诺依曼和图灵走得更远。他们都指定这些非常流行的操作应该在硬件中实现——尽可能快地进行。这是导致人们普遍误解计算机只是算术机的规范。
图灵的架构与冯诺依曼团队的架构有着深刻的不同。图灵指定了一个新的硬件支持概念:软件层次结构。程序员(阅读图灵)很快了解到分层创建程序是一种很好的软件实践。层次结构为那些极长的无意义指令的线性列表之一赋予了意义和结构。
创建软件层次结构就像作者将一本书分成章节列表。假设一个程序有数十万条指令——这在当今世界并不罕见,而且令人难以置信。但是你可以把它分解成一百个部分,每个部分平均有几千条指令,并给每个部分起一个有意义的名字。对程序员来说,程序然后简化为这数百个命名的、有意义的部分——每个都称为一个子程序(不是图灵的话)。在层次结构的最高级别,程序在概念上只有一百条“指令”长,其中每条指令都是一个子程序。它就像一个目录及其章节。
程序员仍然必须创建所有已命名的部分、子程序,以及所有繁琐的细节,而作者仍然必须编写每一章。但是编写每个部分的任务不那么令人难以置信,而且更紧凑。此外,这是一个分层的想法。程序员可以进一步将每个子程序细分为它自己的子子程序,并将它们细分为它们的子程序,依此类推。咬变成小点心,甚至更容易编程。子程序概念将极其复杂的任务驯服为可理解性——例如进一步将章节分解为标题,将标题分解为段落,最后分解为单词本身。图灵的架构指定了一个硬件提升,使子程序的分层使用变得快速和容易。
当然,图灵的架构——具有复杂的子程序支持——应该是被采用的架构,但事实并非如此。Yanks 在 1940 年代广泛传播冯诺依曼的 Edvac 报告,但英国人直到 1986 年才公开发表 Turing 的 Ace 报告。13
伟大的进化生物学家的孙子查尔斯·达尔文爵士在战后试图建立一个英国国家计算资源。他开始得很好。他聘请了图灵并将他带到伦敦附近的国家物理实验室。1945 年底,图灵开始了 NPL 计算机的架构——被称为 Ace——并在不久之后交付了该计划。他在 1946 年的 Ace 报告提到了冯诺依曼稍早一些的 Edvac 报告,该报告展示了 Yanks 的竞争架构。但 Ace 的报告走得更远。它包含一个设计和一个架构——可能是第一个电子计算机设计。图灵投入到构建 Pilot Ace 的项目中,这是基于 Ace 架构的原型计算机。当然,图灵的计算机——来自发明计算的人——应该是长子,但事实并非如此。14
一个问题是图灵本人。首先,他不断地改变架构,因为他想到了绝妙的新想法。其次,他不能很好地发挥团队合作的作用。或者,从积极的角度来说,他具有异常强烈的个性。但其他问题并不是他造成的,例如官僚机构的无能以及概念和工程的不幸物理分离——塔和臭气。将硬件和软件分开并不适合生产计算机。可悲的是,对于达尔文的爱好者来说,孙子达尔文是负责那个烂摊子的官僚。15
飞行员王牌变得如此混乱,以至于图灵在项目完成之前就离开了这个项目,幻想破灭和灰心丧气。达尔文写道:“我们一致认为,最好让图灵暂时停止使用它。” 飞行员艾斯迟到的第一次哭声终于发生在 1950 年 5 月 10 日——几乎是在宝贝之后两年。Pilot Ace 勉强进入前十台计算机的名单。而完整的王牌本身,飞行员王牌和图灵主要目标的孩子,直到他离开十年后才会完成。
然而,在他离开这个项目之前,1947 年,图灵就 Ace 做了他著名的演讲——他使用了新词编程。观众中有工程师汤姆·基尔伯恩,他在前往曼彻斯特的途中短暂停留,他将在那里与弗雷迪·威廉姆斯会合。16
图灵也将在大约一年后到达那里。他不愉快地离开 Ace 项目的幸福结果是他可以使用其他计算机项目。马克斯纽曼需要他。纽曼是剑桥大学的教授,他最初启发了图灵实现他的计算理念的飞跃。然后纽曼敦促图灵去普林斯顿学习。所以现在图灵的老老师和导师中标了他在曼彻斯特的服务,为威廉姆斯和基尔本的婴儿开发软件。
婴儿于 1948 年 6 月 21 日在曼彻斯特大学出生。威廉姆斯和基尔本在一个臭气熏天的实验室——电气工程部门——从零开始设计和建造了它。他们直接负责设计和建造它。Kilburn 编写了它的第一个程序。他们在著名的科学杂志《自然》的九月刊上宣布了婴儿的诞生——我们很自豪地假设。17
纽曼将把图灵带入这个项目,当时他在曼彻斯特数学系的塔楼里。在 Bletchley Park 对几乎是计算机的 Colossus 进行了积极体验之后,他打算在曼彻斯特拥有一台功能齐全的计算机。他认真考虑了洋基队的做法,就像冯诺依曼一样,直到他发现威廉姆斯和基尔本的曼彻斯特主队实际上领先。他立即改变了忠诚度并开始与他们协商关于塔对面的宝贝——臭味分歧。
Baby 的第一个程序是 Kilburn 的,而不是 Turing 的。图灵为搬到曼彻斯特做准备的第一件事就是获得Baby的指令集。他在 1948 年 7 月编写了他的第一个(越野车)婴儿程序,大约在它诞生一个月后,仍然缺席。大约三个月后,也就是 10 月,他抵达曼彻斯特。18
曼彻斯特的工程人员受到了攻击,这是理所当然的,因为太多的功劳归功于图灵和纽曼的宝贝,特别是因为图灵直到后来才出现。其中一些只是塔和臭之间的常用砂纸,但它说明了为一项具有改变世界重要性的复杂技术发明分配功劳的难题。
但是威廉姆斯和基尔本自己告诉我们,图灵和纽曼是宝贝创造的亲密部分。1975 年,威廉姆斯回忆说:“汤姆·基尔本和我对计算机一无所知,但对电路却知之甚少。Newman 教授和 AM Turing 先生对计算机了解很多,而对电子学几乎一无所知。他们牵着我们的手,解释了数字如何住在有地址的房子里,以及如何在计算过程中跟踪他们。” 这可能是威廉姆斯表现出来的讽刺幽默感,而不是准确的历史叙述,但他多次重复这个故事。19
基尔本 1947 年的博士论文使巴比的历史更加复杂,因为它在参考书目中列出了图灵和冯诺依曼的“未发表的作品”。Kilburn 肯定指的是图灵 1947 年的 Ace 演讲和冯·诺依曼 1945 年的 Edvac 报告。尽管威廉姆斯后来只给了图灵和纽曼的荣誉——“数字可以住在有地址的房子里”的俏皮话——但他和 Kilburn 并没有选择图灵的架构. 基尔本在听完图灵的演讲后明确表示,他永远不会那样设计机器。相反,他们为 Baby 使用了冯诺依曼架构。他们口头上称赞了主队,但显然是从另一边的洋基队那里借鉴了想法。20
婴儿茁壮成长,可以说是第二代机器。Mark I(曼彻斯特 Mark I 的缩写)在 1949 年 6 月 18 日运行了一个无错误的程序。Mark I 的记录日期是软的,但保守的出生日期使它成为世界上第四台计算机。图灵为 Mark I 设计了早期的软件规范。21
Mark I 很快就诞生了 Ferranti Mark I,它于 1951 年 2 月 12 日首次亮相,是世界上第一台商用计算机。Ferranti——尽管它的名字是一家英国公司——起初称这台电脑为女士,《卫报》将这个称号美化为“一位具有不可预测倾向的‘女士’”。一张宣传照片显示图灵在夫人的控制台上盘旋。他为 Ace 编写了计算机的编程手册。22
与此同时,在剑桥,莫里斯(发音为“莫里斯”)威尔克斯正在建造 Edsac,这注定是世界上第三台计算机。他为什么不邀请图灵加入那个项目?毕竟,剑桥是图灵的天然家园。他是其国王学院的研究员。图灵一定考虑到了这一点,因为他在 1948 年 5 月访问了威尔克斯,然后于 10 月在曼彻斯特加入纽曼。
相互仇恨很可能压制了这种选择。图灵谈到他与威尔克斯的访问时说,“我一个字都听不进去。” 他早些时候曾批评威尔克斯的一项提议“更符合美国通过大量设备而不是思想解决困难的传统”。(同样来自图灵的那种陈旧的刻板印象。)23
威尔克斯写道:“我发现图灵非常固执己见,并认为他的想法与计算机开发的主流方向大相径庭。” 24
两者在某种程度上都是对的。威尔克斯此时直接从洋基队的冯诺依曼那里获得灵感。像往常一样,图灵正在向他自己的鼓手进军——创造了一个很少有人采用的架构(为 Ace)。
Edsac 的第一次哭泣是在 1949 年 5 月 6 日,比 Baby 晚了将近一年,就在 Mark I. Wilkes 故意选择双胞胎名字来命名冯诺依曼的 Edvac 之前,所以 Edsac 毫不掩饰地挥舞着星条旗上场。25
1999 年,我参加了在剑桥举行的“计算机 50 周年”活动,庆祝 Edsac 成为第一台计算机。听众中有一位来自施乐帕洛阿尔托研究中心的老熟人,威廉纽曼,马克斯纽曼的儿子。Baby 创建时,他们俩都住在曼彻斯特。不久之后,当数学家来到曼彻斯特时,年轻的威廉甚至和艾伦·图灵一起玩过棋盘游戏。威廉在威尔克斯声称 Edsac 优先权时转向我,并以他平静的方式说:“这与我们记忆中的不太一样。” 26
在美国,冯诺依曼(和团队)创建了 Edvac 报告,并在此基础上设计了一台计算机。Edvac 计算机直到很久以后才真正运行,但这并不重要。它所基于的架构——冯诺依曼的——影响深远。有影响力的 1945 年 Edvac 报告广泛传播。即使在今天,这种架构也被广泛使用。令人惊讶的是,甚至连英国人的 Baby 和 Edsac 也使用了它。因此,可以公平地说,存储程序计算机和计算的想法来自图灵,但实际上的计算机——世界上一台有效的机器——起源于冯诺依曼。. . 需要注意的是,图灵和冯诺依曼彼此了解并理解对方的工作,并明确地给予了对方的信任。27
Edvac 至少有 16 个孩子的庞大后代(流程图中显示了 6 个)在许多地方发育。重要的是,它在 Princetitute 开始了 Maniac,von Neumann 担任软件负责人,Julian Bigelow 担任硬件负责人。Maniac 创立了 IBM 701,这是蓝色巨人的第一台商用计算机,它开启了这家巨头公司对计算机的统治。
好像疯子还不够开玩笑,埃德瓦克还生了约翰尼亚克——当然是以约翰尼·冯·诺依曼的名字命名的。这种乐趣让我们在电影Desk Set (1957)中获得了 Emerac,这台计算机与凯瑟琳赫本争夺斯宾塞·特蕾西的注意力和赫本的工作。甚至还有 DC Comics 的超人超级反派 Brainiac。尽管ac在早期的首字母缩略词中通常代表自动计算机,但它在 Maniac 中表示和计算机,在 Edsac 中表示自动计算器(以及在 Emerac 中表示算术计算器,没有抓住重点)。
但命名的乐趣也让普林斯顿大学的塔楼与臭臭之战成为焦点,该学院已经获得了一个有点不体面的绰号来区分其官方自我,普林斯顿大学的普林斯顿高等研究院,也在普林斯顿。在 IAS 的塔楼纯粹主义者的听力范围内,没有人会听说过Maniac这个名字。那里的纯粹主义者称 Maniac为 IAS 机器,它仍然是它的正式名称,并且可以忘记。他们只会容忍工程师和他们的焊枪的存在,而不是他们幼稚的命名欢乐。(毫无疑问,王子学院会让他们不寒而栗。)只要他们留下,冯·诺依曼就是让王子学院臭气熏天的人。就在他 1957 年去世后——就在图灵离奇死亡三年后——这些恶臭被消除了,王子学院也有可能成为计算机科学研究的中心。28
冯诺依曼注意到,作为 Edvac 工作的结果,几乎是计算机的 Eniac 可以通过一些硬件修改变成真正的计算机。进行了修改,冯·诺依曼负责该项目的同事赫尔曼·戈德斯汀(Herman Goldstine)记录了 Eniac 的可编程版本(本书中称为 Eniac+)于 1948 年 9 月 16 日在马里兰州的阿伯丁试验场开始全面运行。Goldstine 的妻子 Adele 帮助对其进行了编程。它的小内存只能存储几十条指令,所以它像Baby一样小,但它是一台计算机。29
Goldstine 的约会将使 Eniac+ 成为世界上第二台计算机。但新的证据有力地表明,与巴比的比赛更接近了。Eniac+ 诞生于 1948 年 4 月 6 日至 7 月 12 日之间的某个时间,具体取决于在任何给定时间执行了多少指令:换句话说,这是一个移动的目标——尽管在该间隔结束时日期会变硬,因为进一步的改进停止了。将最后一个日期作为保守估计,并扣除 Goldstine 的 9 月日期,得出 Eniac+ 的替代生日是 1948 年 7 月 12 日,距离 Baby 于 6 月 21 日出生不到一个月。30
但在 1948 年 5 月 12 日写给约翰·冯·诺依曼的信中,斯坦尼斯劳·乌兰说:“我从尼克 [Metropolis] 的电话中得知,Eniac 的奇迹真的发生了,并且生产了 25,000 张卡片。(到现在还有更多?)这真的很棒,尤其是尼克说他们(卡片)似乎有道理。” 这是令人印象深刻的证据。1948 年 5 月 12 日,也就是 6 月 21 日婴儿出生前一个多月,氢弹的一位创造者对另一位说,Eniac+ 成功地计算了一个困难的氢弹模拟程序。无论您如何称呼这场比赛,Eniac+ 都是一项以前未被普遍认可的重大成就。31
以奥运会的方式来看待英国人与洋基队的比赛——按奖牌数量计算——1948 年底的比分是 1 比 1(Baby,Eniac+)。到 1949 年中期,伯爵以 3 比 1 的比分青睐英国人(Edsac,Mark I)。但随后洋基队开始以这些引人注目的(但完全不包括在内)命中得分:哈里·赫斯基(Harry Huskey)——一名在双方都打球的自由球员工程师——在洛杉矶的国家标准局 (NBS) 建造了 Zephyr。它是 Edvac 的另一个孩子,它于 1950 年 8 月投入使用(并重新命名为 Swac)。1951 年 4 月,Jay Forrester 的旋风(Edvac 的另一个孩子)在麻省理工学院 (MIT) 上线。可以说,它的测试版本更早出现在 1949 年 8 月,Whirlwind–(“Whirlwind minus”)的名称是根据 Eniac+(“Eniac plus”)的精神创造的。1952 年,在王子学院的冯诺依曼团队凭借 Maniac 的奉献精神,洋基队再次得分,并在 1953 年凭借 IBM 701 再次得分。洋基队向前冲锋,从未回头。世界其他地方也加入了这场游戏。到 1953 年,大约十几个国家有 150 个计算机项目。32
电脑到了。在宏伟的计划中,它还不是很快。在 Epoch 2 中,这需要摩尔定律的指数级“速度”来处理。但对完整数字光的所有要求最终并有效地到位——傅里叶波、Kotelnikov 的样本和图灵的计算。
英国人也在与洋基队争夺快速存储设备。对于 Digital Light 来说幸运的是,两个团队都在寻找可见的真空管记忆。两者都将位存储为显示在二维网格上的不同大小的点。因此,每个位置自然既是一位扩展像素又是一位存储器。英国人通过改编普通阴极射线管——威廉姆斯管赢得了这场小规模冲突,然后是这场战斗。洋基队也立即采用了该解决方案。
名片计算机,或任何通用的图灵机,都有无限的内存条。它可以存储无限数量的模式——可数或数字的无限类型。这对于理想的机器来说很好,但是物理计算机必须具有有限的内存。但是不要让有限这个词误导你。即使是第一台计算机也能记住大量的模式。
实际数字如此之大,毫无意义。有趣的数字googol(一个 1 后面跟着一百个 0)是对即使是小婴儿所拥有的状态数量的粗略估计。(谷歌公司就是以这个数字命名的,但创始人拼错了。)更有趣的数字googolplex——一个 1 后跟一个 googol 0——是对即使是最大的现代计算机中的模式数量的严重高估。但是,介于 googol 和 googolplex 之间的那个范围可能会让您了解计算机中的可能模式。然后另一方面,经过更深入的思考,您可能会发现它只是介于两个非常大的数字之间的一个可笑的大数字。真正重要的一点是,计算机让我们这些微不足道的人类处理如此庞大的数量而无需考虑甚至不知道它们——而且从一开始就是这样。33
两个团队的创始工程师都必须选择一种可以存储所有这些状态的实用存储设备。在这两种情况下,他们都选择了电子管的某种变体——因为它的绝对速度。赢得这场比赛的英国人选择使用阴极射线管 CRT。在大数字融合之前,CRT 是一种熟悉的设备。我们用这本书庆祝伟大的数字融合,但它的一个后果是模拟电视的消亡。在那之前,CRT 是每个家庭每台电视机中的巨大玻璃瓶。瓶子扁平的一端是电视屏幕。在过去,电视被亲切地称为“电子管”。
然后工程师们不得不设计一种方法来通过管子移动比特,这是一种模拟设备的数字用途。众所周知,电流是电子的流动,而铜线为其提供了良好的通路。编织在我们每个家庭中的是一个铜线网络,将电流引导到所有这些墙上的插座。但是,电流也可以流过真空——不通过任何东西,这一点并不为人所知。
这正是阴极射线管中发生的事情。电子“枪”是一块加热的金属,它发射电子并将电子从管子的薄端“射”到远、肥、平的一端。如果管中有空气,电子会与其分子碰撞,改变方向并失去能量。为了确保不会发生这样的交通堵塞,所有的空气都被抽出管子,使之成为现实。. . 一个真空管。高压推动电子从一端到另一端。我们将加热的金属片称为阴极,从枪中射出的电子电流称为阴极射线,整个封装称为阴极射线管。
但是我们看不到电子。CRT 必须有其他东西可以将电子转化为光子——转化为可见光。那个东西是管子扁平端的涂层,当它被电子撞击时会发出磷光 - 发光。所谓的磷光体涂层从电子中吸收能量并发射光子。荧光粉在被电子枪射击时会发光。阴极射线的能量越高,发射的光子越多,辉光越亮。光芒在光线的中心最亮,并且随着远离中心的距离平滑地下降。它具有必要的形状,即是一个像样的像素散布器。
它作为存储设备起作用的原因是,在阴极射线停止发送电子后,辉光会持续很短的时间。在那个时间间隔内(比如说五分之一秒),由辉光表示的位被“记住”。它可以使用直到它衰变。通过有条不紊地重绘或刷新,在它衰减之前(每秒五次),我们可以自动让记忆持续多久,只要我们愿意。我们人类用户只看到一个点显示在屏幕上并停留在那里。我有时会说一个点被写入屏幕或在屏幕上绘制,但两者的含义与显示在屏幕上的含义相同。
但是仅在屏幕中央的发光点很无聊。缺少的是一种在管表面的任何地方绘制光的方法。我们需要弯曲阴极射线,使其电子落在屏幕上任何我们想要发光的地方,而不仅仅是中心。对于 Digital Light,我们需要能够绘制散布像素阵列。
幸运的是,移动电子的一个重要特性是它的路径会在它通过磁场时弯曲。就像光线通过玻璃透镜时会发生弯曲一样,阴极射线在通过磁铁的两极之间时也会发生弯曲。安装在阴极射线管电子枪附近的磁铁起到了作用。一个磁体使光线左右偏转,另一个磁体上下偏转。两者的结合可以将阴极射线弯曲到任何所需的位置——而且做得很快。通常使用电场代替磁场,但这是相同的想法。
使用瞄准装置,无论是电动的还是磁性的,您都可以在管的表面上涂抹阴极射线,或者您可以画出漂亮的规则图案。在涂鸦模式下使用的阴极射线管——在任何你想写的地方,在任何方向——是一个书法显示器,来自希腊语,意思是漂亮的笔迹。阴极射线像您书写脚本一样绘制脚本S (图 4.8,左)。射线的强度一直很高。它也通过沿曲线滴落点来以书法方式绘制正确的S(图 4.8 中) ——特别是不在规则间隔的网格点上。在这种情况下,斑点不是散布像素。它们只是点,它们可以有各种形状和可变间距。采样定理没有说明它们。因为它没有,书法展示——尽管它们很优雅——并没有进入新的千年。
另一种显示器的工作原理是这样的:阴极射线有条不紊地绘制出一个矩形图——从左到右一排接着一排,从上到下,就像耕种田地一样。它被称为光栅显示,来自拉丁语rake。在图 4.9 中,光线以光栅顺序在左侧绘制S ,但沿着每一行平滑。老式模拟电视——“电子管”——使用了这种方法。但同样,没有涉及像素,所以这种方法也没有进入新的千年。但是对其进行了修改:光线只能在每个光栅行的规则网格位置上绘制。射线描绘了S在图 4.9 的右侧,带有特定形状的点和网格上的固定位置。实际上,它们是采样定理所要求的扩展像素。
图 4.8
图 4.9
书法与光栅的区别在早期的数码光中是一个很大的区别。你可以看到为什么。书法展示是诱人的优雅。但是尽管他们很优雅,但他们并没有使用像素的概念,这是未来的关键。媒体类型到一种位媒体的大数字融合也迫使显示类型融合到仅基于像素的一种媒体——光栅阵列或网格。从图片(右上方)中看不出这应该有效,但您正在阅读的文本就是它的一个例子。采样定理使具有散布像素的光栅显示与具有平滑笔触的书法显示一样美观。
值得记住的是,所有现代显示器本质上都是模拟的。尽管由数字和断开连接的像素驱动,但我们看到的是平滑和连续的。显示的行为是使分离的像素作为连续的光和颜色场可见的原因。正如我们在第 2 章的采样中看到的那样,在显示的时刻分散像素可以恢复这些像素所代表的原始视觉场景。
现代数字世界的假设是,总会有一个光栅显示器可以让我们的像素可见。我们用户永远不需要知道实际显示设备的令人讨厌的细节。我们在这里关注这些细节的唯一原因是因为最初的展示是最初的记忆。
英国人用威廉姆斯或威廉姆斯-基尔本管赢得了记忆竞赛。但严格来说,Williams 和 Kilburn 并没有发明一种新的管子。他们发明了一种使用标准阴极射线管的技术。他们的计算机内存是使用 Williams-Kilburn 技术进行位存储的 CRT。它存储了一个小点 (0) 或一个较大的点 (1),可以在管的表面上看到,用阴极射线画在那里(并用发光的荧光粉使其可见)。射线将以光栅或倾斜方式从左到右和从上到下扫描管的屏幕。这些比特位于光栅每一行的规则间隔位置——耕地中的种子。
洋基队并没有闲着。起初,冯诺依曼的团队并没有意识到威廉姆斯和基尔伯恩,而是赞助了一次认真的尝试来建造第一个记忆管。他们把希望寄托在 Selectron 上,这是一种由美国无线电公司的一个部门设计和交付的电子管。Vladimir Zworykin 是该部门的负责人,Jan Rajchman 是他的首席设计师和工程师。我们在第 3 章遇到了 Zworykin。他参加了与 von Neumann 的决定性会议,编程成为了一个词。事实上,会议是在 RCA 的 Zworykin 办公室举行的,Rajchman 也在场。Zworykin 在 1920 年代和 1930 年代的电视发明中已经发挥了重要作用。
Zworykin 的小组设计 Selectron 以将位存储为点 (1) 或不存在点 (0)。并且这些位可以被视为通过点(或不是点)的光栅阵列管子的透明玻璃。但 Selectron 比普通的阴极射线管复杂得多。它的发展花了很长时间——致命的长。34
大西洋两岸的早期计算机计划使用可见的记忆,这是一个令人高兴的巧合。不必如此。位不必可见才能用作内存——大多数现代位都不是。值得注意的是,图灵的 Pilot Ace 具有不可见的记忆,即水银延迟线,其中 1 是声脉冲,就像声波一样,它相对缓慢地穿过装满水银的管道。它在旅行时被“记住”。在延迟线中,0 表示没有脉冲。延迟线中的脉冲序列通过管道循环。从管道末端出来的东西会自动重新引入到它的开头,使管道中的位记忆持续到需要的时间。今天计算机的庞大内存中的比特也是不可见的。它们深埋在硅芯片内部。
威廉姆斯管是如此重要的一步,以至于两支球队最终都同意了。在 Baby 出生后的一个月内,Maniac 的主要硬件工程师 Yank Julian Bigelow 在曼彻斯特拜访了 Max Newman,并看到了 Williams 管的运行情况。冯·诺依曼团队长期支持 Zworykin 的 Selectron。但是,一旦毕格罗了解在阴极射线管上存储和读取数据是多么简单,他们就跳下 Zworykin 的船,完全使用威廉姆斯管。他们将其中的 40 个用于 Maniac 的主存储器。在 Yanks 方面,几乎所有 Edvac 报告的第一代后代都采用了威廉姆斯管,包括重要的 IBM 701,这是蓝色巨人计算机王朝的第一台。
美国的 IBM(以冯诺依曼为顾问)刚刚涉足计算机世界,威廉姆斯管赢得了内存竞赛。Thomas J. Watson 准备接任公司董事长一职。他创造了著名的口号“THINK”,该口号现在在整个 IBM 中无处不在。1949 年 7 月,公司出于对 Baby 及其孩子 Mark I 的担忧,邀请威廉姆斯前往其纽约总部。他们问他,“两人和一条狗”组成的团队如何在曼彻斯特制造出比他们,强大的 IBM,所做的一切。威廉姆斯以他严肃的方式回答——可以想象他眼中闪烁的光芒:“嗯,我们有一个存储的想法,然后不顾一切地在那个商店周围建造了一台电脑,没有停下来想太多。” 聚集在一起的 IBM 人员倒吸一口凉气,
威廉姆斯讲述的故事是准确的。计算机相当简单——尤其是一台名为 Baby 的小型计算机。简单的威廉姆斯管已经超越了复杂的 Selectron。在这种情况下,英国人的大脑击败了扬克的肌肉。35
使用威廉姆斯管内存的计算机上的实际显示不是威廉姆斯管本身。它本来可以——几乎没有。威廉姆斯管屏幕上的比特是来自电子枪的电荷,通过荧光粉可见。但是工作的威廉姆斯管需要一个“集电极板”覆盖屏幕。集电极板关闭电子电路中的电路,以便电荷(导致荧光粉发光的电荷)可以被电子电路检测并用于下一次计算。我们说电路读取隐形电荷的存在和数量。电路读取电荷但看不到荧光粉。我们人类读取发光的荧光粉,但看不到相应的电荷。
Baby 主记忆管上的集电板由纱布或细金属丝网制成,因此您实际上可以通过它看到碎片——几乎看不到。没关系,因为珍贵的威廉姆斯管被隐藏起来,以保护它免受杂散电荷的影响——比如一辆路过的摩托车——这可能会破坏它。对工程师来说,集电板上不可见的电荷比屏幕上发光的荧光粉更重要。36
另一个阴极射线管显示了存储在隐藏的威廉姆斯管表面上的比特。这很容易。每次读取一排威廉姆斯管时(例如每秒五次),它都会直接复制到显示管的相应行。显像管不是记忆,只是记忆中发光的、隐藏的屏幕的精确可见副本。由于它仅用于显示,而不是计算,因此不必保护它免受经过的摩托车的影响。我们用这样的显示器来观察或监视一段记忆,我们称之为监视器。
严格来说,第一个比特是第一个扩展的像素,但工程师将它们隐藏在电子保护罩下。散布的像素在那里但看不见——众所周知的树木在森林中倒下时闻所未闻。它们实际上只有在显示器上显示时才对人类可见。
威尔克斯在剑桥的 Edsac 是威廉姆斯管广泛胜利的一个显着例外。事实上,它根本没有使用可见内存——甚至是潜在可见的。与图灵的 Pilot Ace 一样,它使用了水银延迟线。
但 Edsac 的工程师想看看汞延迟线中有什么,因此他们还设计了一个监视器。一个电子电路将通过延迟线的脉冲序列转换成一组绘制在阴极射线管屏幕上的点。电子设备将脉冲串放入延迟线中,并将它们折叠成多排点——从一排长排(512 位)到一个由较短排(每排 32 位)组成的矩形。然后,它以通常的阴极射线管方式(以光栅阵列形式)简单地在监视器屏幕上绘制斑点。这台显示器使英国剑桥的英国人 Edsac 成为 Digital Light 竞赛中的另一个参与者。请注意,监视器可以就像一排长长的灯一样,而不是二维数组。显示器技术导致光栅显示是一个令人愉快的意外。
美国剑桥麻省理工学院的 Yanks' Whirlwind 是威廉姆斯管闪电战的另一个值得注意的例外。Jay Forrester 的团队改进了威廉姆斯管的想法,以满足旋风的更高速度要求。他们创造了一种竞争性存储器,但仍将比特存储在阴极射线管上,就像威廉姆斯管一样。然而,他们似乎从未打算将记忆管用于图片显示。37
因为完善这种类似威廉姆斯的“静电存储器”需要很长时间,Forrester 和他的团队使用他们所谓的“测试存储”来存储 Whirlwind 的存储设备。其中大部分是拨动开关!人类“编写”了拨动开关。Whirlwind 可以读取它们但不能写入它们——用计算机术语来说是只读存储器。该团队设计了一个特殊的监视器来显示测试存储的内容。38
虽然不太像一台完整的计算机,而且编程繁琐,但 Whirlwind 的测试配置在 1949 年 8 月 19 日首次成功使用。我将测试配置称为 Whirlwind——(“Whirlwind 减号”),因为它比Whirlwind,它应该是一个完整的存储程序计算机。将其分开是不寻常的,但在 Digital Light 的历史上这样做很重要。
在我的探索中,我发现了一个宝库——旋风摄影档案。它们不在麻省理工学院,我希望在那里找到它们,而是在贝德福德附近的秘密 MITRE 公司。2016 年 10 月 11 日,公司档案管理员 Krista Ferrante 迎来了我,这是我在研究这本书时度过的最激动人心、最有意义的日子之一。她为我准备了一辆装满了精心编目照片的手推车。他们有很多。早期的 Whirlwind 用户根本没有为拍照而道歉。克里斯塔和我愉快地整理了几个小时,我能够从中挑选出突破。
这是一个鲜为人知的例子(图 4.10),可能是 Whirlwind 项目的第一张数字图片。它是在 1949 年 6 月创建的,可能是手动切换的,因为即使是旋风——几乎是旋风,还没有准备好编程。缩写代表旋风一号,这是计算机的全称,于 1951 年 4 月正式宣布完成。
图 4.10
为了确定哪个内存位置与显示屏上的某个点相对应,麻省理工学院的工程师 Bob Everett 发明了一种“光枪”,它可以与显示屏交互并导致某个点关闭。它正在擦除(图 4.11)选定的点或散布像素,以制作稍晚一点的数码照片,这张照片的日期为 1952 年 4 月。这是 Yank 与数码照片的早期互动,但不像英国人那样早,我们将很快就会看到。39
1949 年 9 月,Whirlwind– 添加了“特别展示”。它也是一个阴极射线管。这台示波器,正如他们所说的(借用电子工程师工具的名称),可以在其二维屏幕上的任何点绘制一个点。它不限于栅格网格位置。这些斑点写在管子的表面上,但旋风——无法阅读它们。也就是说,它们不是它的记忆的一部分。它们也不是它记忆碎片的图像。示波器不是像 Baby 或 Edsac 那样的显示器。它纯粹是一种图形显示设备——这是计算机上的第一个设备。图形显示设备上的每个图像都是有意的二维图片。
图 4.11
这是数字光的一个重大发展。它允许您从存储在计算机内存中的不可见描述或模型创建图片。这就是我们所说的计算机图形学。
由 Charlie Adams 领导的 Whirlwind 程序员于 1949 年底开始使用存储在大多数拨动开关的测试存储器中的程序来制作图片。图 4.12 是 1950 年 5 月 18 日制作的抛物线和带轴的四次曲线,是 Whirlwind– 早期图片的典型代表。这些图片中的每一张的模型都以数学方程的形式存储。40
大多数旋风 - 图片都是二维的。但是图 4.13 显示了两张描绘三维表面的图片,可能是第一次,1950 年 3 月 6 日。他们简要介绍了即将到来的照片,但值得注意的是,它们不是透视图。这一根本性的进步是十多年后的事,等待着它的布鲁内莱斯基。
图 4.12
图 4.13
图 4.14
图片由计算机历史博物馆提供。
示波器是一种书法设备。它可以在屏幕上的任何点上绘制一个点,来自任何方向和任意间距,而不仅仅是沿着水平线的规则间隔的采样位置。这只是另一种说法,这些斑点既不是比特也不是散布像素。因此开始了数字光的书法与光栅分裂。计算机图形学的主线——Digital Light 的一个主要部门——将在大约十年后从这个书法分支发展而来。它将被千禧年的光栅分支和大数字融合所包含。41
Harry Huskey 打算将图 4.14 中的数字图像作为图片。它来自另一台带有威廉姆斯管内存的计算机,但这是扬克斯的机器。它的工程师 Huskey 并不容易被认定为 Yank 或 Brit,因为他首先在美国从事 Eniac 工作,然后在英国从事 Turing 的 Pilot Ace 工作。然后他回到美国,按照冯·诺依曼的 Edvac 的模型,制造了一台他称之为 Zephyr 的机器——正如这里所宣传的那样。
我在 2013 年遇到了 Huskey 博士,当时他在加利福尼亚州山景城的计算机历史博物馆担任研究员。他已经 97 岁了。他回忆说,那是 1948 年末,他使用与 Kilburn 相同的技术手动将这张图像的位切换到威廉姆斯管存储器中。制作了第三张数码照片在 Zephyr 开发的早期。该计算机于 1950 年 8 月更名为 Swac 并专用。42
图 4.15
洋基队在 1948 年的 Selectron 努力未能及时成功地成为冯诺依曼的疯子的记忆。但它仍然是早期数字光的参与者,因为一个不知名的人用手将图片(图 4.15)切换到 Selectron。它显示了 RCA 的首字母缩写,后面跟着一行四个点,代表 RCA 实验室,Zworykin 和 Rajchman 在那里开发了 Selectron。Rajchman 在这项工作中特别重要,所以他可能创造了这幅画。
1946 年,Eniac 和 Edvac 团队成员 J. Presper Eckert 又为 Yank 努力实现了可见记忆。他和他的团队试图将比特存储在阴极射线管上,并且成功了,但他们未能将这些位保持足够长的时间来构成一个严肃的记忆。埃克特的努力是美国佬与英国人争夺第一个电子存储器的又一次小冲突,而美国佬又输了。43
图 4.16
尽管 Eckert 未能为自己的设计建立一个可见的记忆,但他在得知 Williams 和 Kilburn 的结果后立即开始工作。Eckert 小组中的工程师 Herman Lukoff 按下按钮,将他的首字母“HL”输入到内存中,以进行耐力测试。Lukoff 在 1948 年 12 月至 1949 年 3 月之间的某个时间创作了这张照片,尽管我们没有它的照片。然而,这种内存从未在计算机中使用过。44
图灵 1951 年 3 月的 Ferranti Mark I 编程手册包含图 4.16 左侧所示的照片。Kilburn 在 1951 年 12 月举行的一次计算机会议上展示了它。这张照片的右半部分(带有台阶)可能是在程序控制下创建的数字图片,但它很粗糙,没有说服力。它的左半部分是偶然的废话,显示了内存位的状态,但没有二维连贯性,绝对不是数字图片。
同一次会议的参与者还看到了 Whirlwind 的早期书法图片,如图 4.16 中的右侧照片所示。这张照片肯定是由程序生成的。这是会议记录中仅有的两张数字图像。他们公开宣布,实际上,书法与光栅分割已经开始。旋风图片至少可以作为计算机图形的示例,因为存储的计算机程序使用内部模型来驱动显示器(无论是书法还是光栅)。在这种情况下,模型是一个七阶多项式的数学方程——简洁、抽象、不可见。这张照片提供了进一步的证据,证明旋风团队在 1950 年代初开始拍照。45
图 4.17
这两张图片的合成(图 4.17)及其标题来自 1952 年 12 月的 Ferranti Mark I 营销手册。标题清楚地表明,图片的商业潜力终于在这家早期制造商身上显现出来。图片毕竟是认真的。我们知道复选标记图片是程序生成的,因为最初曼彻斯特队的一员戴爱德华兹告诉我们。它可能是 1938 年从柏林到曼彻斯特的犹太移民迪特里希·普林茨(Dietrich Prinz)在紧要关头编写的。46
自从计算机出现以来,游戏就一直伴随着我们。更一般地说,交互性已经伴随我们很久了。令人惊讶的是,自 Digital Light 出现以来,游戏就推动了计算机的创新,而且自从我们第一次遇到最复杂的机器以来,我们一直坚持与它们进行交互。
Christopher Strachey(“Stray chee”)是 Turing 在剑桥的同学,他试图在 Pilot Ace 上运行一个跳棋程序——用英式英语进行的跳棋程序。他在 1951 年 5 月 15 日的一封信中告诉图灵,它起作用了。然后 Strachey 得知在曼彻斯特的 Mark I 的记忆要大得多,Baby 的孩子。当然,记忆可见的事实也给他留下了深刻的印象。他为它重新编写了程序,最迟在 1952 年 7 月 9 日之前,它在商业版 Ferranti Mark I 上运行——使用图灵的编程手册。47
“他自己写了这本手册,当我拿到一份副本时,我明白了为什么它以难以理解而闻名,”图灵的 Strachey 说。“人们只是不习惯阅读准确的描述,而艾伦略微烦躁的假设每个人都和他一样聪明,这加剧了这种情况。”
棋盘的连续状态显示在计算机的威廉姆斯管上。图 4.18 显示了 Strachey 的六张原始图片。它们来自存储程序控制下的计算机。
Strachey 的草稿程序是第一个视频游戏的竞争者——迄今为止记录的最好的程序。但是在 1950 年到 1952 年期间制造了几台计算机,其中任何一台都可能被编程用于游戏(或静态图片或动画)。正如我们将看到的,肯定有传闻的竞争者。
国际象棋从来都不是竞争者,尽管图灵是该游戏的知名粉丝。克劳德香农也是如此,他于 1950 年在曼彻斯特访问图灵并谈论它。迪特里希·普林茨(Dietrich Prinz)也是如此,他早年在曼彻斯特加入了费兰蒂(Ferranti)。斯特拉奇也是如此。当时这个游戏对计算机来说太难了,但是 Prinz 能够在 1951 年在 Ferranti Mark I 上编写它的一部分,即残局(在将死的两步内)。尽管他可能是生成复选标记图像的程序员(图 4.17),没有证据表明他的国际象棋程序使用了视觉显示。
第一个电子游戏的两个紧密竞争者出现在剑桥的 Edsac 上。Stanley Gill 在 1952 年 11 月的剑桥博士论文中描述了一个简单的程序一只羊靠近栅栏上的一对门。Edsac 为栅栏展示了一条垂直线,我们被告知,大门有一个上间隙或下间隙。在程序预测将打开的大门对面画了一条水平线。Edsac 的纸带阅读器的光束可能会被玩家挥手打开顶门打断。否则下层门打开了。绵羊和大门的图形(如果不是游戏的话)将与后来的 Pong 电子游戏一样简单。唉,没有人拍照。48
图 4.18
Alexander Shafto “Sandy” Douglas 确实为他的游戏创作拍摄了照片(图 4.19)。大约在 1952 年,但在 1953 年 3 月之前,他将井字游戏(英式英语的 noughts 和 crosss)编入了 Edsac。这三张图片是他从电脑显示器上拍摄的原件。使用类似于我在其他软日期情况下所做的保守估计,Gill 的 1952 年 11 月战胜了道格拉斯的 1953 年 3 月,使他们成为第二和第三知名电子游戏的创造者。以同样的论点,跳棋优先于羊和门(美式英语),而草稿则轻推noughts(英式)。49
图 4.19
图 4.20
英国人拥有第一个记录在案的数字图片和交互式视频游戏。当然他们也有早期的动画,因为很明显Baby可以动画。但奇怪的是,没有任何关于早期婴儿动画的证据浮出水面——甚至没有轶事。Baby和Edsac都显示了数字图像序列,但它们只是记忆中的偶然内容。50
Edsac 上可能有一位动画高地舞者,但唯一的证据是轶事报道。据我们所知,美国佬拥有第一个记录在案的二维图片时间序列意义上的计算机动画。这是麻省理工学院的旋风。51
1951 年 6 月 11 日出版的 Whirlwind 编程手册以“弹跳球显示”为特色。示波器显示的示意图(图 4.20)如下程序本身的文本列表,由 Charlie Adams 编写。根据标题,这些点是按时间连续显示的。这显然是第一个记录在案的计算机动画,但它可能只是一张缓慢渲染的静止画面——没有仔细控制时间。每个点一旦显示出来,就会简单地衰减以呈现一个弹跳球的外观——好吧,无论如何都是一个弹跳点。
图 4.21
像往常一样,我会选择保守的出版日期 1951 年 6 月 11 日,作为这张照片的“官方”日期,可能还有第一部动画。它得到 1951 年 12 月 13 日的官方旋风照片(图 4.21)的支持。52
我为这张照片而烦恼,因为它的影响力。亚当斯表示,这可能是“在静电存储投入使用之前,Whirlwind 最广为人知的演示”。意思是旋风——,换句话说。亚当斯和他的同事杰克吉尔摩(Jack Gilmore)于 1950 年 10 月加入他的行列,将弹跳点(“球”)修改为一种游戏(图 4.22)。而且他们在每次弹跳时都添加了“砰”的一声,所以这个版本绝对是一个动画。53
玩家将交互式地改变反弹的频率,获胜者是第一个让“球”穿过地板上的一个洞——沿着水平轴的一个缺口——发出不同的声音。这种“游戏”的最早已知照片是 1953 年 6 月的旋风照片。54
公开的代码并没有表明这是一个等待下一个玩家移动的循环程序——换句话说,它是真正的交互式程序。相反,它似乎一直是一个程序,每次重新启动时都会通过拨动开关输入一组不同的三个初始条件(如图 4.21 中的手绘图所示)。无论如何,这构成交互性并称之为早期视频游戏是很诱人的。有些有。这当然是一种游戏形式。这个“游戏”鼓励麻省理工学院的学生坚持编写 Whirlwind- 的繁琐过程。55
图 4.22
弹跳点最终是动画,如果不是在 1951 年 6 月,那么到 1953 年 6 月。但前两个经过验证和注明日期的计算机动画确实出现在旋风上,在 1951 年。一个是光栅,另一个是书法。
Edward R. Murrow 于 1951 年 12 月 16 日的电视节目See It Now以两部旋风动画为特色。节目以图 4.23 所示的光栅动画开始。单词HELLO MR. MURROW以散布像素呈现。单词中的每一列斑点依次变亮,然后变暗,大概是在计算机控制下。(右图是模拟。)另一个动画(未显示)显示了一个移动点,它描绘了导弹的抛物线轨迹。这幅画是用书法方式绘制的,沿着曲线一次一点,没有留下任何痕迹。这是移动“球”的第一次反弹。56
图 4.23
数学家马丁戴维斯告诉我一个故事,它建立了洋基队的另一个早期动画,肯定是在基于像素的显示器上。1952 年春天,戴维斯在伊利诺伊大学短暂调试代码。他使用的计算机是 Ordvac,它是 Edvac 的另一个孩子。它于 1951 年春天投入使用。就像 Maniac 一样,它有 40 个威廉姆斯管和一个可以切换以显示其中任何一个的显示器。戴维斯报告说,得到他的妻子弗吉尼亚的证实,有人编写了一个程序来显示该信息HELLO VISITOR! THIS IS THE ORDVAC.字母是显示器的高度,所以消息太长,无法一次看到。相反,当消息在监视器上滚动时显示出来。因此,这部早期的电脑动画创作于 1951 年春季和 1952 年春季之间的某个时间。保守的约会时间将其定为 1952 年春季。57
在同一轶事类别中还有一份来自 Richard Merwin 的报告,他曾在 Eniac 工作,然后在 Los Alamos 的 Maniac(Edvac 报告的另一个后代),然后是 IBM 702。Dick 和我是 IEEE 计算机科学家代表团的成员1978 年,尼克松在中国进行开创性访问后不久,中国对旅游业敞开大门之前不久,他们被邀请到中国呆一个月。在一个令人难忘的时刻,当我们的公共汽车经过紫禁城时,迪克告诉我他见过的第一部电脑动画——一个酒瓶将里面的东西倒入酒杯——在 1950 年代初在威廉姆斯管上展示。他描述的动画可能是在 Maniac 上,但可能是在 1952 年或 1953 年的某个时候在 IBM 701 上,或者后来在他工作的 IBM 702 上。可悲的是不再活着来证实他们。也许它与我从劳伦斯利弗莫尔国家实验室的图形先驱乔治迈克尔那里听到的另一个版本混为一谈:1950 年代初期的 IBM 701 计算机使用了啤酒瓶将其内容物倒入玻璃杯中的动画作为其威廉姆斯管的内存检查记忆。计算机图形学先驱 Robin Forrest 报告了另一个变体:“据称,一位聪明的程序员设法编写了一个程序,该程序可以显示水流入玻璃杯的动画。” 58
您可能会反对 First Light 不是图片,因为它是文本:C.R.T. STORE。但是文本是任何合理定义的图片。每张图像都准确地——用我们将熟悉的术语——将几何定义的字母和数字渲染成像素,就像现代动画电影是将几何定义的字符渲染成像素一样。
图片的锯齿状性质令人不快。Kilburn 在没有采样定理的情况下天真地制作了它们。怀疑他是否听说过。Kotelnikov 在 1933 年的第一次陈述是用俄语,而香农的英语普及直到 1948 年才出现。图灵早在 1943 年就知道采样定理——这与香农声称它在该领域众所周知——但图灵没有当 Kilburn 创作第一张数码照片 First Light 时,他们还没有抵达曼彻斯特。并且没有理由认为图灵,无论他多么聪明,曾经想过将采样定理应用于视觉领域。
每个像素只有一位或两个值,无论是否天真,Kilburn 的尝试都已尽善尽美。在他的威廉姆斯管内存中根本没有足够的像素——也没有足够的比特位——来准确地表示一个定义平滑、边缘锐利的物体,比如一个字母。在频率峰值中,像素的位置远不接近(两倍)字母中的最高空间频率。这些不仅是第一张照片,而且还首次展示了要使 Digital Light 成功必须解决的“锯齿”难题。
所有最初的图片、电子游戏和动画——除了麻省理工学院的书法图片——都是将简单的几何对象——字母、数字、线条、曲线和正方形——临时转换为一位像素。它们是幼稚的渲染——不知道采样定理。还没有人意识到采样的最终重要性,这个想法最终将实现大数字融合。这就是为什么我不介意在这个早期阶段混淆旋风人单独使用的书法显示与其他人使用的光栅显示。书法展示是我们幼稚童年的一部分。
图 4.24
考虑到天真,图 4.24(左)中的 1760 采样器暗示了对此处勾画的数字光的早期历史的反对。(顺便说一句,sampler似乎非常合适,但来自这个词的完全不同的含义——一个人的工作样本,在这种情况下是 Elizabeth Laidman 的针线活。)为什么这不是 Digital Light 的前身?为什么没有任何带有图片的纺织品或挂毯?还是任何马赛克,例如图 4.24(右)中的马赛克,它描绘了由规则间隔的瓷砖构成的图像?这些中的任何一个都是由天真的采样形成的——没有采样定理——就像第一光一样。
嗯,它们是数码照片的前身和数码光的前身。毫无疑问。一方面,它们被铭记在线或瓷砖的永久记忆中。几个世纪甚至数千年的时间里,肯定有成千上万个类似的前身。但是从他们的离散样本到今天的现代图片(比如你现在正在阅读的文字)没有明显的技术路径。下一部分是关于第一个像素的更重要的竞争者。
图 4.25
电传打字机——一种远距离打字的机器——是一个古老的概念,也被称为电传打字机或电传打字机。(严格来说,电传打字机是一个商品名称。)基本上,当电信号传输到类似打字机的机器时,它就会起作用,该机器通过在一张纸上键入其键将信号转换为字母。每个可用字母都有一个独特的信号。
根据我们对数字图片的定义,任意类型的消息不是数字图片,因为它无意成为连贯的二维图片。但是,如果将打字的字母以二维方式排列,并且完全有意将结果视为图片,那又会怎样呢?图 4.25 显示了两个例子,一个是麦当娜和孩子,另一个是达格·哈马舍尔德,他在 1953 年成为最年轻的联合国秘书长。注意叠印字符,这很容易用电传打字机完成。59
问题是:如果唯一信号是数字位,那么我们可以将其解释为一个像素,然后将输入的字母解释为该像素的显示元素吗?这不是一个随意的问题,因为可以说信号在 1874 年变成了数字信号,当时 Émile Baudot(发音为“boh Doh”)设计了一个我们可以识别的“五单元”系统今天作为 5 位编码方案。上面两张图片最初可能是在 Baudot 代码中指定的。一个字形显示元素的灰度值(包括由叠印字母字符形成的那些)大致是该字形占据的矩形区域中黑到白的相对量。60
这些年来,人们制作了成百上千张这样的照片——其中很大一部分是裸体照片——并在粉丝之间传播,首先是通过电报,然后是业余无线电。业余爱好者会用输入信号驱动电传打字机,打印图片,同时在纸带上打孔。纸带变成了记忆,可以从中复制多份副本或发送给朋友——比如圣诞节问候。因此,在计算机出现之前(即 1948 年之前)以及之后的十多年里,计算机仍然稀有且昂贵,这是一种常见的地下拍照方法。例如 1947 年的麦当娜和儿童以及 1962 年的哈马舍尔德。61
电传艺术时代跨越了计算机的诞生,并迅速轻松地适应了计算机世界。为取代鲍多代码的电传打字机开发了新代码,并成为计算机与打印机终端(例如电传打字机)对话的代码。重叠的历史迫使我们思考数字光的定义。它提出了这个定义延伸的问题:在计算机出现之前,电传打字机编码是第一个像素吗?
不完全的。由于朴素的采样和粗略的重建,我们可以将它们视为数码光像素的早期前身。但因为记忆系统是纸带,而不是电子记忆,它们不符合数码光的定义。为了与本书中的其他定义保持一致,我们坚持涉及电子计算机内存。
在 1950 年代、1960 年代、1970 年代,甚至 1980 年代,幼稚的抽样非常猖獗——根本不基于抽样的书法展示也是如此。直到 1960 年到 1970 年的数字光时代,我们才开始看到将采样定理应用于像素计算的第一个提示。这些早期努力的特点是在用于注释图片的几何形状或字形的边缘进行水平软化。用行话来说,这是水平抗锯齿。62
如果采样的速率低于采样定理所需的速率,则未表示的较高频率会在结果中显示为称为混叠的视觉噪声。抗锯齿是锯齿问题的一种解决方案,一种消除令人不快的锯齿的方法,因为锯齿被人们熟悉地称为锯齿。采样定理的正确应用需要计算能力,这就是为什么早期使用它内置在硬件中。在软件中实现它等待摩尔定律的进一步力量。
图 4.26
图 4.27
几何模型的第一个显式和完全抗锯齿(在两个维度上)可能是我们在 1973 年施乐帕洛阿尔托研究中心的 Richard Shoup 在图 4.26 中看到的(但请参阅注释以了解可能的 1971 年前身)。锯齿线位于顶部,抗锯齿版本位于底部。63
Shoup(听起来像呐喊)也在 1973 年制作了图 4.27 所示的巡回赛马车车轮图片(左侧为锯齿状,右侧为抗锯齿)。他没有明确地对这些图片中的任何一张使用采样定理,但平滑的结果证明他的方法是等效的。它们由 8 位灰度像素组成,具有老式的视频分辨率(每个大约 500 像素宽)。64
在犹他大学首次明确使用采样定理进行空间抗锯齿。那里的数字音频专家 Thomas Stockham 在 1970 年代向一代早期计算机图形学先驱教授了采样定理。犹他州学生 Ed Catmull 在 1974 年的博士论文中展示了抗锯齿图片。那里的另一位学生 Frank Crow 在 1976 年的博士论文和随后的出版物中将 Stockham 的教学带到了计算机图形学界。65
无论你如何解析历史,很明显,Digital Light 是与计算机的诞生同时诞生的。First Light 是在婴儿的子宫内创建的。第一个像素实际上是第一台计算机内存的位。关键的年份是从 1947 年到 1952 年。婴儿记忆管上的第一张测试图片和存储程序计算机上的第一张故意程序生成的图片之间可能有一两年的间隔。即便如此,到 1951 年,计算机上仍能用存储程序控制的像素制作图片。这些像素天真地来源于几何模型,通常是字母、数字或其他简单形状。有些模型是交互式的,有些是动画的。采样定理的真正和充分使用可能始于 1970 年代初期。
像素统一了所有数字光的历史,包括计算机图形、视频游戏、图像处理、数字摄影、应用程序或操作系统界面、数字电视、动画电影、虚拟现实等。从这个有利的角度来看,几十年来在计算机图形学中使用书法显示可以被视为绕道而行。显示器上显示元素密度的大幅增加以及摩尔定律在计算速度方面的巨大改进允许光栅显示包含书法显示并将数字光返回到其光栅根。显示器向单一光栅类型的崩溃最终实现了各种视觉媒体的大数字融合。采样定理是像素的基础。
我们现在已经准备好将三个伟大的想法——频率、采样和计算——应用并投入到两种技术中,一种是旧的,一种是新的。旧的是电影。重温电影历史的一个原因是为我们提供 Digital Light 将采用的词汇。制作一部数字电影不可避免地依赖并衍生于现有的电影和动画技术。但主要的原因是为了展示采样这一伟大想法如何不仅可以理解图片,还可以理解移动的图片流。事实证明,电影技术也依赖于采样定理,尽管当时没有人知道。采样定理为我们提供了一种更好的方式来思考电影。我们将遇到几个新的英雄和暴君,并重温被误传的故事。
运动的绝对连续性是人类思维无法理解的。任何种类的运动定律只有在人检查运动中任意选择的元素时才能理解。但与此同时,很大一部分人为错误来自于将连续运动任意划分为不连续的元素。
——列夫·托尔斯泰,战争与和平1
起源是滑溜溜的东西,比喻和字面意义上的,电影可能是有史以来最滑溜的媒体。. . . 起源笼罩在令人生畏的禁忌和驱使好奇心的混合物中,构成了权力和所有权要求的令人不安的混合物(通常是虚假的,总是简化的):不可避免的进步的神话;民族自豪感;和简单的错误信息。面对索赔和反索赔的蛇坑,标志着电影起源的纯粹自我主义和混淆可能会举手投降。
——汤姆·冈宁,曼诺尼《光与影的伟大艺术2 》简介
电影史比计算机史更具争议性。许多美国人相信托马斯·爱迪生发明了电影——否则就是那个不发音的埃德沃德·迈布里奇。法国人确信这是他们自己的卢米埃兄弟。将如此复杂的技术成果简单化当然是错误的。就像电影结尾的电影片尾字幕一样,总有许多贡献者对一部精彩的作品至关重要。说,不仅仅是导演、男主角或编剧。当然不是钱人或首席营销人员。不,电影的真实故事是一片荆棘,比电脑更棘手。
这两个世界之间有几个隐喻的联系,但真正的联系是采样。Kotelnikov 教我们如何将音频流采样为索像素,将视野采样为像素。但是也可以对流入我们眼睛的视野进行采样。视觉流示例的熟悉名称是frame。我们将一系列帧称为电影或电影。视觉流——随时间变化的视野时间——也是所有的音乐。波和采样的伟大想法适用。然后将计算的概念——图灵的好主意——应用于帧(以及像素和索素),为我们带来了数字光的全部荣耀。
简而言之,我们可以通过定期拍摄的离散快照准确地表示不断变化的视野——我们的眼睛实际看到的东西。每个样本都是那一刻呈现在我们眼前的静止画面。我们可以忽略帧之间发生的所有事情,因为在显示时,样本被电影放映机传播成一个连续的流,准确地代表了原始的视觉流。
问题是,发明电影的男人(他们都是男人)都不知道这一点。他们创建的系统也没有以这种漂亮的方式工作。采样定理不存在——再过半个世纪。因此,发明者完全天真地创造了电影技术,并带有伤痕来证明这一点。那个笨拙的年轻人的缺陷,一个世纪前被锁定在系统中,仍然存在。Digital Light 并非一蹴而就。它继承了它的历史。
在本章中,我们从电影史中抽取离散样本,并从它们中重建出一部更加连贯的历史——一部更加诚实、不那么具有传奇色彩的历史。电影史上的暴君是商人,而不是皇帝或独裁者:利兰·斯坦福到爱德华·迈布里奇,托马斯·爱迪生到威廉·肯尼迪·劳里·迪克森,沃尔特·迪斯尼到 Ub Iwerks。在所有这些情况下(还有更多),支配者是被支配者成功的基础——反之亦然。两者都很重要。我们发现许多神话——迈布里奇是电影之父,爱迪生如何发明电影,迪斯尼如何创造米老鼠——被证明是错误的。
他起初是泰迪马格里奇。或者也许是艾迪。我们不知道他妈妈真正的喜爱,但直到很久以后他肯定不是 Eadweard Muybridge。这个名字是他众多别名中的最后一个,也是最奇怪的一个。他的正式名字是爱德华·詹姆斯·马格里奇,出生在伦敦附近的泰晤士河畔金斯敦。这张表记录了这位著名表演者在公众面前进行的名字游戏——他的名字的变体与他的姓氏的变体一起使用:3
|
1830–55 |
1855–56 |
1856–62 |
1862–65 |
1866–68 |
1869–1904 |
|---|---|---|---|---|---|
|
马格里奇 |
马格里奇 |
麦格里奇 |
迈布里奇 |
赫利俄斯 |
迈布里奇 |
|
爱德华·詹姆斯泰德·爱德华 |
EJ |
EJ爱德华詹姆斯 |
EJ |
爱德华·爱德华多·圣地亚哥·埃德沃德 ('82–'04) |
他在这里永远是 Edward Muybridge(简称为“我的桥”),因为他在这个别名下完成了他最伟大的工作——对 Digital Light 很重要的工作。
他以 EJ Muggridge 的身份来到美国——带着一个gg。到1860 年,当他登上一辆从加利福尼亚开往东部的巴特菲尔德陆路驿马车时,他已成为 EJ Muygridge(拥有yg )。他没有成功。对他的未来如此重要的横贯大陆铁路将是一个更好的选择——但它还不存在。事实上,六匹巴特菲尔德马在德克萨斯州的某处沿着著名的舞台线吓坏了,他被从马车上扔了下来。他遭受了足够的身体——也许是精神——的伤害,以至于起诉巴特菲尔德并赢得了和解。1861 年,他仍然是 Muygridge,现在回到英国,当时他试图为洗衣机申请专利。他是第一个迈布里奇——与yb——1862 年在另一项英国专利申请中,这一项用于印刷工艺。奇怪的是,他从未尝试为他最重要的发明——Zoöpraxiscope——申请专利,而这项发明尚未到来。(电影设备的名字和电脑的名字一样有趣。)
他最丰富多彩的别名是 Helios(只有一个字)。在约翰·缪尔(John Muir)首次支持加利福尼亚奇妙的优胜美地山谷(Yosemite Valley)时,他开始成为一种新的艺术家,摄影艺术家,在旧金山取得了这个名字。赫利俄斯(太阳神摄影师)拍摄了一些最早且广受好评的强大优胜美地照片。
正是他的谋杀案审判让他声名狼藉——又是迈布里奇先生,现在是爱德华迈布里奇。一个全是男性的陪审团裁定他在旧金山附近枪杀了他妻子的情人——以及他孩子可能的父亲——无罪。毫无疑问,他杀死了这个人——用一把他完全打算用于此目的的手枪直指胸膛。尽管有法官的告诫,陪审团并不打算在加州淘金热之后找到一个捍卫自己“荣誉”(!?)的人犯有谋杀罪。4
迈布里奇只是在晚年 52 岁时才影响了古怪的 Eadweard,因为他在巴黎的艺术界声名鹊起。他肯定是从家乡泰晤士河畔金斯敦著名的加冕石(图 5.1)中得到的。900 年代,两位名叫爱德华的国王在这块石头上加冕。在它的底部两次浮雕是Eadweard - 古英语拼写。所以迈布里奇的最终名字只是“Ed ward”,尽管转录很容易起皱。
在 Helios 和 Eadweard 之间,普通的爱德华完成了他令人难忘的工作。他的赞助人利兰·斯坦福(Leland Stanford)从建造第一条横贯大陆的铁路中获得了令人发指的强盗大亨财富——这些铁马将巴特菲尔德驿马车及其多肉的马带入了遗忘(或修剪整齐的椭圆形轨道)。当然,他巨额财富的主要遗产是斯坦福大学,硅谷将在斯坦福大学(在 1960 年代)成为摩尔定律的温床。但在他自己的时代,斯坦福大学在赛马——他的热情——尤其是猪身上投入了大量资金。
图 5.1
图 5.2
爱德华·迈布里奇 (Edward Muybridge) 以这个名字着称,他在中途小跑时拦住了斯坦福最喜欢的小跑之一,一张照片显示所有四只蹄子都离地。公认的智慧是迈布里奇从那里开始发明电影。这归功于他第一次演示,当以相似的速度投影时,一系列快速连续拍摄的运动物体(例如马或裸体男人或女人)的静止照片似乎显示了运动中的物体。但这个故事并非如此。5
他实际上所做的是这样的。他在斯坦福的农场上建造了一个 24 摄像头的设备——The Farm,这是斯坦福学生今天对校园的称呼。他使用了一个巧妙的触发机制,当一匹马疾驰而过时,快速连续地打开每个相机的快门。每个照相机在涂有化学乳剂的玻璃板上形成一个单一的摄影图像。这些印版必须立即在现场开发。6
为了展示结果,他使用了公共演讲者用来投射静止图像的著名魔术灯——当时的 PowerPoint。他在其中添加了一个比旧的长播放 (LP) 唱片更大的旋转磁盘。他在圆盘的边缘放置了小画,每幅画都来自连续的马照片,如图 5.2 所示(左,快门在右)。当圆盘以或多或少均匀的速度旋转时,投影图像似乎在移动,再现了马的运动。一个完整的循环大约需要一两秒。7
1880 年 1 月 16 日,迈布里奇在 Leland Stanford 位于旧金山的豪宅中放映了这部假定的第一部电影。但这种说法存在几个问题。为了例如,他没有投影相框。它们是从照片中衍生出来的画作。他用一定程度的扭曲修改了画作——水平拉长的腿和身体——以适应他的投影系统的扭曲伪影。而且他没有电影摄影机,只有一系列静态摄影机,每个摄影机的视角略有不同。最后,只有他可以使用该系统,因为它已经固定到位。说一个没有电影摄影机、不使用胶卷、不投影照片的系统是一个电影系统,这是一个太大的飞跃。就像几乎是计算机一样,他的系统充其量也就是电影,这是一个延伸。8
迈布里奇并不是第一个展示静止图像运动的人,无论是摄影静止图像还是从中衍生出的轮廓。在 1860 年代和 1870 年代流行的 Zoëtrope 做到了这一点(图 5.3)。想象一个大约半英尺高、直径两英尺的纸板圆筒。如果你打开盒子里的灯,如果你足够小,可以放进盒子里,你会看到围绕圆柱体圆周的一系列图片,它们的顶部对齐。每张图片都是一个序列中的一张,比方说一匹马在小跑中连续走几步。当然,你不能装在圆柱体里面,所以为了让你从外面窥视,每张照片之间的墙壁上都开有缝隙。通过每个狭缝,您可以看到对面墙上的一张图片。如果你要在圆柱体外面走来走去,你会看到每个缝隙都显示下一张图片,即马小跑的下一部分。现在想象一下,当圆柱体转动时,您从外部固定位置观察圆柱体。在狭缝之间,你看到了黑暗。只有当狭缝旋转到位时,您才能看到图片。就是正对面的图片,是马的下一段小跑。因此,当圆柱体以适当的速度旋转时,您会看到一系列照片,显然都在同一个位置,从您的眼睛穿过圆柱体。从这一系列样本中,您可以看到一匹马在小跑。您可能已经意识到这或多或少也是电影电影的工作方式,鼓的黑暗部分用作快门。图 5.3 由 William Kennedy Laurie (WKL) Dickson 绘制——这个名字值得记住。现在想象一下,当圆柱体转动时,您从外部固定位置观察圆柱体。在狭缝之间,你看到了黑暗。只有当狭缝旋转到位时,您才能看到图片。就是正对面的图片,是马的下一段小跑。因此,当圆柱体以适当的速度旋转时,您会看到一系列照片,显然都在同一个位置,从您的眼睛穿过圆柱体。从这一系列样本中,您可以看到一匹马在小跑。您可能已经意识到这或多或少也是电影电影的工作方式,鼓的黑暗部分用作快门。图 5.3 由 William Kennedy Laurie (WKL) Dickson 绘制——这个名字值得记住。现在想象一下,当圆柱体转动时,您从外部固定位置观察圆柱体。在狭缝之间,你看到了黑暗。只有当狭缝旋转到位时,您才能看到图片。就是正对面的图片,是马的下一段小跑。因此,当圆柱体以适当的速度旋转时,您会看到一系列照片,显然都在同一个位置,从您的眼睛穿过圆柱体。从这一系列样本中,您可以看到一匹马在小跑。您可能已经意识到这或多或少也是电影电影的工作方式,鼓的黑暗部分用作快门。图 5.3 由 William Kennedy Laurie (WKL) Dickson 绘制——这个名字值得记住。只有当狭缝旋转到位时,您才能看到图片。就是正对面的图片,是马的下一段小跑。因此,当圆柱体以适当的速度旋转时,您会看到一系列照片,显然都在同一个位置,从您的眼睛穿过圆柱体。从这一系列样本中,您可以看到一匹马在小跑。您可能已经意识到这或多或少也是电影电影的工作方式,鼓的黑暗部分用作快门。图 5.3 由 William Kennedy Laurie (WKL) Dickson 绘制——这个名字值得记住。只有当狭缝旋转到位时,您才能看到图片。就是正对面的图片,是马的下一段小跑。因此,当圆柱体以适当的速度旋转时,您会看到一系列照片,显然都在同一个位置,从您的眼睛穿过圆柱体。从这一系列样本中,您可以看到一匹马在小跑。您可能已经意识到这或多或少也是电影电影的工作方式,鼓的黑暗部分用作快门。图 5.3 由 William Kennedy Laurie (WKL) Dickson 绘制——这个名字值得记住。从这一系列样本中,您可以看到一匹马在小跑。您可能已经意识到这或多或少也是电影电影的工作方式,鼓的黑暗部分用作快门。图 5.3 由 William Kennedy Laurie (WKL) Dickson 绘制——这个名字值得记住。从这一系列样本中,您可以看到一匹马在小跑。您可能已经意识到这或多或少也是电影电影的工作方式,鼓的黑暗部分用作快门。图 5.3 由 William Kennedy Laurie (WKL) Dickson 绘制——这个名字值得记住。9
Zoëtrope 中的图片可以是照片或源自照片的绘画。如果你忽略图像来源于照片的要求,那么中国人在大约两千年前就发明了西洋镜。西洋镜中的图像不仅限于马。10
迈布里奇也不是第一个投影图像序列的人。Athanasius Kircher 在 1671 年就这样做了,或者至少写过它。关于写作的附带条件是必要的,因为 Kircher 将镜头放在幻灯片的错误一侧(图 5.4),如果他实际制造了投影仪,他会注意到这一点。实施是橡胶与创意之路相遇的地方。11
图 5.3
在本章的后面,我们将从现实世界中拍摄的真人电影到由虚幻世界制作的动画电影。令人惊讶的是,迈布里奇的原创贡献与动画电影更为相关。上个世纪的动画师通过用墨水逐帧追踪在摄影胶片上运动中捕捉到的人或动物,从电影中衍生出卡通片。这种技术,称为rotoscoping,是迈布里奇为他所谓的第一部电影所做的。
动画师也以扭曲他们的卡通而闻名——使用称为挤压和拉伸、夸张和预期的技术——以适应低幼稚的采样电影率。迈布里奇在那部所谓的第一部电影中拉伸了马匹(或为他完成了工作)。仔细查看迈布里奇光盘上的图像。因此,他可以更恰当地被人们铭记为第一个使用转描和拉伸的人,这一成就有点羞于发明电影。12
图 5.4
如果你想一想,迈布里奇最真正令人难忘的遗产是那些移动的裸体和动物的连续照片的奇妙静态阵列,今天仍然普遍作为他的作品集的明信片、海报或专辑。它们像数字图像中的像素光栅一样从左到右和从上到下排列。
动画师高度重视这些迈布里奇光栅。在 1920 年代初期,两个年轻的朋友,Ub Iwerks 和 Walt Disney,在他们推出了他们刚刚起步的动画业务时向他们学习。动画师今天仍然尊重他们。图 5.5 是 Pixar 动画师的恶搞和高度赞扬。迈布里奇为斯坦福大学著名地证明了一匹马的所有四英尺都在一帧内离开地面,而这项“最近重新发现的工作”确定了 Luxo 台灯的一英尺离开地面四帧。
一些作家指责强盗男爵斯坦福从迈布里奇那里窃取信用,但检查记录表明并非如此。几十年前,在浏览在一家古董书店,我发现了一本 1882 年的大型毛绒书,名为《奔跑的马》。我相信这是最初的迈布里奇研究,对任何对动画感兴趣的人都很有名。
图 5.5
©皮克斯。
但事实并非如此——反正也不完全是。首先,作者不是迈布里奇。是我从未听说过的 JDB Stillman。打开扉页,我发现 Leland Stanford 确实资助了该出版物,正如预期的那样。迈布里奇在哪里?我很快就找到了他,作为“先生。迈布里奇,”在第一段中突出显示。“由 EJ Muybridge 先生提供”的附录描述了他的技术。和“先生。迈布里奇”也出现在最后一段,从而包含了整本书。13
从正文中可以清楚地看出,斯坦福和斯蒂尔曼根本不关心摄影。马的运动对他们来说很重要。迈布里奇的照片与其说是艺术品,不如说是出租作品——称它们为意味着结束。斯蒂尔曼确实提到了作品的艺术意义,但他的意思只是艺术家对马的准确演绎。马就是问题。那么,为什么迈布里奇会因为这本书起诉斯坦福?
图 5.6
到其出版时,他已前往巴黎并为自己加冕为高贵的 Eadweard(图 5.6,右)。他向那里的艺术界宣布,他发明了一种新的艺术形式,并且是大亨斯坦福的好友(图 5.6,左)。他用马和人在运动中让他们惊叹不已。他是预测运动的雄狮营销者,他受到了崇拜。他还说服了艾萨克·牛顿在英国的皇家学会接受他的论文《运动中动物的态度》并安排出版。但随后斯蒂尔曼的书出现了,仅仅提到了受雇工作,斯坦福声称拍摄一匹运动的马是他自己的想法。重要的是,迈布里奇的名字不在扉页上。皇家学会拒绝发表这篇论文,怀疑是抄袭。迈布里奇被羞辱了。他的一些新粉丝认为他是个骗子。14
他把西装弄丢了。现在这一切似乎都被误导了。斯坦福的一切都是关于马的。迈布里奇是关于摄影技术的。拍摄运动中的马是斯坦福在 1872年的想法——这一想法受到 1874 年科普文章的重新启发关于 Étienne-Jules Marey 在法国的工作。但正是迈布里奇的发明使之成为可能。这是一场不同形式的塔楼与恶臭之战——理念与工程。斯坦福将这些照片全部归功于他为这项任务聘请的人。事实上,他以一美元的价格将这项技术的知识产权转让给了迈布里奇。他完全错过了这项技术的潜在进口,无论是在艺术上还是在经济上。15
然而,富有的斯坦福大学凭借知名度、金钱、设备和空间,让发明家迈布里奇向世界展示了快速拍摄以相同快速序列投影的连续照片给人一种运动的错觉。斯坦福为此付出了代价——付出了很多——却从来不知道他到底资助了什么。这不是关于马的。华丽的迈布里奇成功地将这个想法推向了广泛的领域——这也许是他对电影最重要的贡献。“电影之父”对他来说似乎离谱,但“电影的约翰尼苹果种子”却很合适。特别是,他的节目激发了托马斯·阿尔瓦·爱迪生对美国电影的兴趣,并影响了法国的马雷。这就是即将到来的洋基队与法兰克队比赛的第一缕曙光。16
对计算机的仔细定义帮助我们修剪了计算机故事中的历史主张。它扫清了通往 Digital Light 的道路。我们可以对电影史采用相同的技术。
让我们也使用另一种适用于计算机的方法:将硬件与软件分开。对于电影院来说,电影本身就是软件。事实上,软件本身就是我们通常所说的“电影院”。我们可以在电影、电视或手机上看到《公民凯恩》。像往常一样,神奇之处在于软件——钢琴中的肖邦练习曲。但这本书的一个基本概念建立在对我们现代媒体文化的欣赏之上,而现代媒体文化本身依赖于对其技术基础的直观理解——在这两个领域中看到奇迹和美景。由于有大量关于电影软件(电影)的书籍,我们专注于未被充分认识的硬件。
但在过于仓促地转向硬件之前,让我们先看看电影软件的一个奇怪之处。尽管电影放映机只能沿电影的一个方向移动,但存储在电影上的软件可以让观众感知时间倒退(倒叙,爱尔兰人)或向前(比如十年后,甚至千年,2001:太空漫游)的事件),或者无限循环(土拨鼠日),或者随着变化的重复(罗生门)。就好像电影软件在我们的大脑上计算了它在电影硬件上无法计算的东西。
没有一个词可以形容那种硬件,电影院的硬件。经典电影具有三个可分离的部分:相机、胶卷和投影仪。通过说电影机器,我们指的是所有三个——就好像它们在一个黑盒子里一样——这就是我们的定义。电影机器之于电影就像计算机之于计算。少了任何东西,充其量就是一台电影机器——就像上一章的电脑一样。由于硬件在这里是隐含的,所以我经常放弃机器这个词,并将电影和电影这两个术语与电影互换使用。17
所以,当我们问谁制作了第一部电影时,我们并不是指第一个内容。我们指的是谁拥有第一台电影机——第一台相机、胶片和投影仪作为一个系统协同工作。这就是上世纪大部分时间我们所说的电影,硬件方面的意思,今天仍然如此。在数码光中,我们有数码相机,存储数码相框,并用数码投影仪进行投影。
电影应该起作用并不明显。电影并不像进入我们眼睛的视觉那样流畅。相机每秒只记录 24 个视觉流的快照,并丢弃帧之间发生的一切——但我们还是感知到了流。我们看到静止,但我们感知到运动。我们该如何解释呢?
如果我们今天从采样定理开始作为数字光的一部分发明电影系统,它会是什么样子?答案似乎很简单:以视觉流中最高时间频率的两倍将视觉流采样到帧中,然后在投影期间使用良好的扩展器将帧扩展回平滑的视觉流——就像我们将像素变成单个静止图片一样.
让我们把这个描述分开。首先,视觉流中的频率是多少?傅里叶用来表示它的波是什么?我们必须先了解这一点,然后才能应用采样定理——最高频率两倍的采样业务。我们还需要确定视觉流中的“最高频率”是什么意思。然后我们必须弄清楚投影帧的“好的吊具”是什么。展开框架是什么意思?
对于音频,波是声波。对于静止的视觉场景,波浪是傅里叶章节中显示的光强度的起伏波纹。回想一下我对伯克利多肉花园的直观分析。需要一些练习才能开始“看到”构成该视觉场景的有节奏的空间波。在视觉流中“看到”波浪也需要练习。
这里有一些练习可以帮助你看到它们。看着一个人走过。或者一个女人慢跑。他的动作是循环的,她的也是。这是流入你眼睛的傅立叶版本的波的第一个证据。假设这个人每秒踩一次脚,或者每两秒踩一次完整的一步。那么在流的波形版本中必须有一个频率为每两秒一个周期(相当于每秒半个周期)的波。假设女人慢跑的速度是男人走路的两倍。那么,在流入你眼睛的波浪版本中,一定有一个频率为每秒一个周期的波浪。
其他示例包括: 沿街道行驶的汽车流。汽车上的纺车。抽自行车踏板。嘴唇在布朗克斯欢呼。挥手告别。交响乐团指挥的手。一个弹跳球。
从这些到傅立叶的神奇想法是一个巨大的飞跃,但让我们接受它:你在视觉流中看到的一切都是视觉波的总和,并且只是视觉波的总和,而视觉波的东西是摆动的光强度有节奏地在空间和时间上。
在傅里叶一章中,我们将构成视觉场景的波浪(静态图片)可视化为波纹,每个波纹都有一个波浪横截面。也就是说,波纹的横截面看起来像时钟秒针描绘的波浪。幸运的是,我们不必为了使用它们而实际看到视觉流的波——运动图像的波。这很好,因为视觉流的傅里叶波是一个四维的东西,很难想象。尽管如此,让我们尝试一下。图 5.7——显示了一个时间周期的一半和四个完整的空间周期——试图显示一个这样的波,但它需要一些想象力。
考虑图中最顶部的波纹。它像往常一样具有频率和幅度。一个小箭头表示其幅度。请注意,该箭头的副本已被推到最右侧,然后旋转了 90 度。我很快就会回到那个旋转的箭头。
波纹的幅度随时间变化,沿页面向下移动。此外,振幅随着时钟的秒针波的节奏平滑地变化。但我画不出来。相反,我呼吁你的想象力。
想象一下,你正在看一个单一的波纹,但当你观察时,它的波浪高度随着波浪的节奏而变化。另一种说法是,当你观察时,所有的波谷同时变深,然后同时变浅,然后同时变深,依此类推,那种脉动的节奏就是波浪的节奏。在您的脑海中绘制该动画的单张图片是一项任务。坦率地说,就本书而言,你脑海中的动画已经足够好了。它是表示视觉流所需的各种傅里叶波。
图 5.7
然而,图 5.7 试图捕捉该动画。它用九个波纹(如果你愿意的话,动画的九帧)在等间隔的时间代表你脑海中的脉动波纹。我呼吁你的想象力(再次)在描绘的每一对之间的每一刻都放置一个波纹。问题是它们的模拟无穷大是必需的。
一个小箭头显示特定时刻波纹的幅度。这些小箭头的副本被推到最右边并如前所述旋转。连接旋转箭头尖端的曲线是波浪。当您想象在所描绘的任何一对之间插入波纹时,请使用右侧波上的对应点作为其幅度。
总之,视觉流的单个傅立叶波在空间中变化为波(或波纹),并且在时间上也作为波变化。这个脉动波纹上的每个点都是一个光强度。它在所有三个维度以波浪的节奏摆动时空果冻。
所以这是一波。现在想象一下它们的整个家族,每个都以特定的频率和幅度在空间中荡漾,每个人都以另一种频率和幅度在时间中脉动。这要求很多。您可以理解为什么从业者只是简单地使用简洁地表达同一件事的数学。根据傅里叶的伟大想法,完整的视觉流是这种完美波的总和,具有许多频率和幅度(以及方向和相位)。视觉流是时空音乐。
采样定理——Kotelnikov 的好主意——说我们需要以视觉流中最高时间频率的两倍来采样或帧,以便准确地表示流。最高频率可能是多少?在这一点上,早期电影创作者的完全天真变得显而易见。他们只是猜测。他们没有最高频率的概念。他们最关心的是电影的成本,而不是表现的准确性。帧速率越高,他们必须使用的胶卷就越多。因此,使用尽可能低的时间采样率在经济上是明智的。新兴的电影业很快(到 1920 年代)以每秒 24 帧的速度稳定下来,大约一个世纪以来一直如此。18
但在理想世界中,我们应该关心的视觉流的最高频率是多少?回想一下经验法则,在频率方面,视觉场景中非常锐利的边缘具有非常高的频率。在将场景采样为像素之前,我们会通过稍微模糊场景来消除任何过高的频率。否则采样失败,我们会得到令人讨厌的伪影——比如被称为锯齿的阶梯状边缘。
视觉流动也是如此——视觉场景随时间变化——同样的技巧也有效。视觉流中的锐利“边缘”是运动方向的突然变化。再想想那个路过的人。假设他正在摆动他的手臂。此时此刻他的手臂一直向后摆动,然后反转方向开始向前摆动,是一瞬间的视觉流动边缘。或者考虑一个弹跳球。反弹的时刻是视觉流中的一个尖锐边缘。在将视觉流采样到帧电影中之前,这些边缘应该被“四舍五入”才能准确工作。换言之,必须去除过高的时间频率。不这样做会产生令人讨厌的伪影——比如看起来向后旋转的轮子。我们很快就会花时间解决这个问题。
理想的电影放映机如何从离散帧重建视觉流?正如已经建议的那样,可以使用与显示设备如何从离散像素重建视觉场景直接类比的采样定理来完成。显示器使用像素散布器(通过空间)散布每个像素,并将结果相加。理想的投影仪会通过帧扩展器扩展每一帧——随着时间的推移——并将结果相加。那么,什么是框架扩展器?
图 5.8(上)提醒我们采样定理的理想散布器是什么样的。对于 soxels(音频样本或声音元素),这是及时的扩展器。在像素的情况下,这是理想像素散布器在空间中的横截面。在电影帧的情况下,它是理想帧扩展器的横截面。
这种理想的吊具在实践中无法实现,因为它的范围是无限的。这些摆动在任何一个方向上都会永远持续下去。图 5.8(中)中的近似值是我们在 Kotelnikov 章节中使用的近似值,用于从像素中很好地重建视觉场景。
但即使是这种近似的扩展器也不适用于老式的模拟电影世界,因为有两个负波瓣 - 水平线下方的两个倾角。我们不知道如何使投影仪的光变为负值(小于黑色),因此我们无法实现上面的帧扩展器。然而,我们可以使用图 5.8(底部)中的近似值。
由于扩展框架对大多数人来说是一个新想法,让我们逐步了解这种扩展器形状的含义。时间在下图中向右推进,图 5.9,水平线中心的点表示当前帧时间——投影仪对该帧最大照明的时刻。中心左侧的点代表前一帧时间——当它达到最大照明时。中心右侧的点代表下一帧时间——当它达到最大照明时。等等。详细地说,投影仪光在前一帧时间内逐渐出现(由中心左侧的点表示)。它在当前帧时间的瞬间(中心的点)达到最大强度。然后逐渐消亡在随后的帧时间内(中心右侧的点)。这就是及时传播帧的含义。
图 5.8
您可能还记得,样本的重建是通过将扩展器应用于所有样本并将结果相加来完成的。这是棘手的部分,因为现在我们在时间而不是空间上传播。这意味着在查看当前帧时,我们仍然看到前两帧并开始看到接下来的两帧。由于良好的吊具重叠,理想的投影仪可以同时照亮多个帧。它将投影镜头处的贡献加在一起,从而加到屏幕上。选择的时刻(图 5.9 中的垂直线)恰好发生在当前帧的最大照明之前。在那一刻,前一帧的照明已经下降到大约三分之一的全强度,而前一帧的照明几乎为零。同时,当前帧之后的帧的照明刚刚开始出现。之后的框架还没有点亮。因此,在所选瞬间,四帧对投影图像有贡献——当然是当前帧,还有前两帧和后一帧的添加。
图 5.9
令人惊讶的是:实际上从来没有这样的电影放映机存在过。抽样理论告诉我们,本来可以有一个美丽完美的电影系统。这样的投影仪可以重建平滑的视觉流程。我们的眼睛进化到能够感知以这种方式呈现的世界。这不是我们所拥有的,但这个练习告诉我们我们可以拥有什么,以及在数字时代我们应该对电影提出什么要求。没有理由不应该存在这样的系统。19
现实世界的电影实际上是那个理想系统的粗略近似——而且它足够接近,可以做得很好。让我们看看它是如何工作的,疣和所有。
电影的发明者做了什么(或没有做什么)使他们给我们的系统如此不理想?首先,他们没有按照抽样要求给我们瞬时样本。电影框架很胖。他们有持续时间。相机快门打开一小段曝光时间。一个移动的物体在那个短时间间隔内移动,因此在胶片曝光期间会稍微拖过画面。这就像当您尝试拍摄您的孩子扔球的长时间曝光静态照片时会发生什么,而他的手臂只是一片模糊。事实证明,这是电影的一种节省方式,因为它实际上是在实践的。
其次,他们做到了,每一帧都被投影仪投影两次(至少)。哎哟! 这根本不是抽样。发明者为什么这样做?简单的经济学要求它:每秒 24 帧的胶卷成本是每秒 48 帧的一半。但是眼睛需要每秒刷新大约 50 次,否则视网膜图像会在帧之间褪色。实际上,48 与 50 接近,足以在黑暗的剧院工作。如何从 24 中获得 48?您将每帧显示两次!如果每秒仅显示 24 帧,则屏幕会闪烁。因此,在采用更高帧速率之前,电影早期的“轻弹”。
最初的发明者做的第三件事是关闭投影帧之间的光。这意味着每秒 48 次,没有任何东西(黑度)投射到眼睛中——瞳孔内,视网膜上。对电影机来说很方便——两者兼而有之相机和投影仪部件——在帧之间像这样“快门”到黑色。它为下一个胶片帧的机械推进到位留出了时间。在相机中,它使胶卷在胶卷的物理推进过程中无法记录真实世界。在投影仪中,它使移动的胶片在物理上处于先进状态时不被看到。
当你问电影放映机的工作原理时,有人会这样说:有一个上卷轴是胶卷的来源,一个下卷轴。胶片从一个卷轴移动到另一个卷轴,并在投影机的光源和镜头之间通过,从而将帧大小的图像放大到屏幕大小。换言之,胶片连续移动通过光源。但这不起作用。眼睛可以准确地看到那里有什么,通过这种方案,当下一帧从另一侧滑入时,眼睛会看到一帧滑开。它会看到滑动。那是行不通的。
投影仪实际上所做的正是这样:它将每一帧都置于固定位置,并遮住光源。这就是快门的作用。然后快门打开,被照亮的框架投射到屏幕上。然后快门关闭。然后它再次打开,被照亮的框架第二次投射到屏幕上。然后快门关闭,下一帧滑入到位,依此类推。
我们刚刚描述了胶片通过放映机的离散或间歇运动,而不是不可行的连续运动。同样的想法也适用于相机。实现这一动作的物理装置,实际上称为间歇运动。这是电影史上的关键概念,可与计算机历史中的条件分支指令相媲美。对电影机的疯狂追捧取决于谁首先让投影仪正常工作,而这取决于谁让间歇性运动正常工作。这是一个定义性的概念。20
回顾一下:基于电影的实际电影放映机不会从帧样本中重建连续的视觉流并将其呈现给眼睛。相反,它会将“脂肪样本”——随着时间的推移和运动模糊而变厚——直接发送到眼睛的视网膜。它每帧发送两次,并在两者之间发送黑度。从这些输入中重建运动取决于大脑。这是如何运作的?
不知何故,眼脑系统“重建了由它接收到的脂肪视觉样本所代表的视觉流”。当然,它真的没有这样的事情。光强度作为输入通过瞳孔进入。但从眼睛到大脑的输出,通过视神经,是一个电化学脉冲序列。神经元脉冲序列不是视觉流。可能是视网膜确实重建了视觉流,然后将其转换为脉冲序列供大脑消耗。眼睛中一些神经元的反应肯定表明了扩张器功能,完成了高正驼峰和负叶。但是大脑活动超出了本书的范围。让我们而是专注于从静止快照序列中对运动感知的习惯解释。
经典的解释是陈旧的视力持久性. 这是人类视觉的一个真实特征:一旦对视网膜的图像刺激停止,我们会在短时间内继续感知那里的图像。但视觉暂留只能解释为什么在电影电影的情况下看不到帧之间的黑度。如果演员或动画角色在帧之间移动到一个新位置,那么——通过视觉的持久性——你应该在两个位置上看到他:两个汉弗莱·鲍嘉,两个巴斯光年。事实上,你的视网膜确实看到了两者,一个随着另一个进入而淡出——每一帧都被投射足够长的时间来确保这一点。这就是视觉的持久性。但这并不能解释为什么你感知到一个移动的物体,而不是两个不同位置的物体。
心理物理学家进行了实验以确定另一种真实大脑现象的特征,称为表观运动。这些实验没有解释大脑如何感知运动,但它们确实描述了这种现象的局限性。黑色背景上的一个小白点呈现给对象的视网膜。然后那个点被移除,另一个点出现在不同的位置。实验者可以改变两件事,两个点的空间分离和位置变化之间的时间延迟。大脑在这里感知一个点,那里感知另一个点,但前提是距离和延迟足够长。如果距离和延迟很短,大脑会感知到点从一个位置移动到另一个位置。很明显运动,因为没有实际运动呈现给眼睛。大脑感知它看不到的东西。
视觉的持久性是这样的,当第二个图像到达时,我们仍然能感知到第一个图像。这听起来很像帧扩展。一个持续时间短的帧在时间上展开并添加到下一帧也及时展开。就好像视网膜进行图像扩展和连续扩展帧的添加。这样的事情一定会发生,因为我们感知到一个连续的视野,尽管电影放映机没有呈现。您可以将眼睛的余辉函数的形状想象为内置于我们人类感知器中的帧扩展器的形状。我们可以假设眼-脑系统必须进行重建的另一个原因,即隐含使用采样定理的重建,是因为我们准确地感知到错误如果那是实际的机制,我们会预料到——比如马车车轮向后旋转。21
经典的 cel 动画——旧的赛璐珞墨水品种——依赖于表观运动现象。老动画师凭直觉知道如何将动作的连续帧保持在“不太远,不太慢”的界限内。如果他们需要超过这些限制,他们有技巧来帮助我们感知运动。他们绘制了实际的速度线,向大脑显示了运动的方向,并暗示它很快,就像一个模糊的东西。或者,当 Wile E. Coyote 出人意料地踏下台地,紧追那个真正狡猾的 Road Runner 时,他们提供了一阵灰尘来标记他的快速下降。它们提供了一种大脑可以解释的视觉语言。
超过明显的运动限制——没有那些动画师的技巧——结果很丑。您可能已经看过老式的定格动画,例如雷·哈里豪森 (Ray Harryhausen) 在Jason and the Argonauts (1963) 中的经典格斗骷髅,这些动画被角色令人不快的抽搐动作所困扰。你至少看到了双重的——同时有几条骨架的边缘——并正确地将其解释为运动,但令人痛苦的是。屏幕上的边缘口吃,或“颤抖”或“频闪”。这些话反映了断奏所带来的痛苦。
真人电影是一系列离散帧,就像动画一样。为什么这些电影不卡顿?(想象一下指示 Uma Thurman 保持在“不要太远,不要太慢”的限制内。)有一个普遍的解释是有效的。这叫做运动模糊,而且简单漂亮。由真正的电影摄影机记录的帧很长。它不像 Road Runner 或 Harryhausen 框架那样瞬间成为样本。运动模糊是当主体移动并且快门速度不足以停止运动时您在静止照片中看到的。在静态照片中,这通常是一个意想不到的结果,但事实证明它是电影中的一个特征。如果没有模糊,所有电影都会像哈利豪森的骷髅一样生涩——除非乌玛奇迹般地保持在限制范围内。胖帧中移动物体的运动模糊为大脑提供了关于什么在移动和什么不在移动的线索。模糊的方向表示运动的方向,其长度表示速度。不知何故,神秘地,
我们这些在老西部电影中长大的人当时清楚地看到了倒退的车轮。驿马车的轮子占据了大片的银幕空间——以及很长的银幕时间——因为有很多追逐。带头巾的土匪是永远背着一个月的黄金工资单去追逐舞台。令人不安的是,车轮显然以错误的速度旋转,甚至经常向后旋转。
电视也是一种采样媒体,所以当电视出现时,我们继续看到车轮倒转,将西部片作为午后节目的重要组成部分。即使在今天,许多汽车广告都展示了车轮以错误的速度甚至向后旋转,但令人惊讶的是,很少有人再看到它们了。现代导演很聪明地将它们隐藏在尘埃云或方便放置的植物和岩石后面。或者,当轮子进入屏幕中心时,它们会进入完全慢动作,因此它们看起来可以正确旋转。或者他们什么都不做。我们都经常看到这个工件,以至于我们现在根本没有“看到”它。
但是为什么车轮会向后旋转?采样定理非常清楚。我们必须以所拍摄动作中包含的最高频率的两倍进行采样。回溯一下,在传统的电影采样率下,可以以每秒 24 帧的速度表示的最快运动是多少?每秒变化不超过 12 次的东西。
考虑一下驿马车的前轮——就像曾经在德克萨斯州抛弃 Muygridge 的失控的巴特菲尔德舞台一样。为方便起见,假设它有 12 英尺长,有 12 个辐条。货车每向前移动 1 英尺,车轮就会转一整圈的十二分之一,并且下一个辐条会旋转到与前一个完全相同的位置。因此,在部分旋转之后,车轮看起来完全一样。
如果一匹马以每秒 12 英尺的速度移动舞台,则视觉流的傅立叶波版本中的波将以每秒 12 个周期变化。这意味着每秒有 24 个样本(帧)的电影几乎不能代表以每秒 12 英尺的速度移动的驿马车。但这只是每小时大约 8 英里。再快一点,怪事就开始了。由于一匹奔腾的马可以达到每小时 25 到 30 英里的速度,那些土匪肯定会让马车的车轮超过这个采样速度限制。因此,即使是一部每秒 24 帧的理想电影,也无法准确地表示车轮比慢速街道交通中的车轮移动得更快。
但我们知道电影电影以某种方式在大脑中起作用。我们的大脑用来从两个静止图像中推断运动的明显运动现象也可以感知运动方向。在旋转物体的情况下,大脑占据辐条的两个位置并感知它们之间的运动,尤其是在运动模糊的帮助下。它根据两个样本的相对位置决定运动的方向。它以最短路径为假设。
如果位置 2 的辐条从位置 1 的辐条顺时针转动并靠近它——只有很小的角度分离——大脑会假设车轮是顺时针旋转的。如果靠近但逆时针方向,大脑假设车轮逆时针旋转。因此,大脑会混淆前向和后向运动,因为它只看到样本,而不是它们之间的平滑视觉流。22
由于理想电影和电影电影都涉及采样,因此在更高的速度下肯定会出现伪影。如果我们未能以(超过)视觉流中最高频率的两倍进行采样,则需要付出代价。在频率方面,运动混叠成错误的运动——例如向后旋转或向前旋转太慢。它呈现出一种虚假的视觉表现——一个别名。
不!坚决不!没有,从来没有,活生生的画面的发明者。
——亨利·霍普伍德,《活生生的图画》,1899 23
与计算机一样,需要一个复杂的流程图才能开始代表电影硬件的早期历史。它也让我们看到了人、概念和机器之间的复杂关系。这也是对实际故事的简化。许多名称、设备和国家被省略以减少混淆程度,同时保留足够的细节来表明重要技术开发的实际复杂性。与计算机一样,许多其他播放器和机器出现在注释中。
上一章中计算机历史的简化流程图仅保留了最终对 Digital Light 重要的人员和发展。这里的等效简化(图 5.10)是只遵循那些类似于前千禧年时期(几乎正是二十世纪(1895-2000))的主导电影系统的系统。我们将那些无胶片或无框架的系统降级为“电影前”——任何基于简单旋转的 Zoëtrope 或 Zoöpraxiscope。
一个主要的简化是从这张图表中完全省略了光化学薄膜本身。提到的每个系统都依赖于它。掌握赛璐珞电影对早期电影系统至关重要。这是一个困难的媒介。它很脆,容易划伤,边缘卷曲,并且具有化学活性。发明者必须制作曝光时间短、分辨率高的胶片。开发和打印它们必须快速且可靠。对于早期的发明者来说,这是一场噩梦,但对于用比特代替胶片的 Digital Light 来说,这并不重要。24
再一次,与计算机一样,我们调用奥林匹克隐喻来跟踪许多球员。这次的主要球队是洋基队和法兰克队。为这张流程图选择的玩家促成了五个强大工作室的崛起,Edison、Biograph、卢米埃尔、高蒙和百代。一张真正显示对早期电影的所有贡献的详细图表必然会显示许多其他早期发明者和设备,并且它将至少包含另外两个国家,一个英国团队和一个德国团队。25
图 5.10
也许最有趣的遗漏是法国、英国和美国的路易·勒王子。1888 年,他在约克郡的利兹制作了短片。它们仍然可以在互联网上以数字重建的形式找到。1890 年,他在法国登上了一列火车,显然是前往巴黎,最终前往纽约展示他的发明。但他从未成功——甚至没有到巴黎。他只是消失了。他的家人认为爱迪生将他视为一个严肃的竞争对手,并将他除名——这不太可能发生,但却表明了爱迪生的暴虐名声。根据一份宣誓书,到 1889 年,勒普林斯拥有了第一个完整的摄影机、胶卷和放映机系统。但这并不重要,因为它显然对电影的发展没有进一步的影响。26
下面的文字作为电影流程图的扩展说明——首先是洋基队,然后是法兰克队。但它最重要的信息是明确的:它所代表的历史是复杂的,有着压倒性的细节。推论出来的信息是,如果我们听到有人声称自己是电影之父或发明者,我们应该立即发出危险信号。第二个主要信息是 1895 年是电影年,就像 1948 年是计算机年一样。1895 年是放映机的一年,也是第一次使用赛璐珞胶片实现完整电影机器的一年。
爱迪生的名字和参与保证了媒体的广泛关注。. . . 不仅机器 [Vitascope] 得到了他的完全认可,而且“门洛帕克的向导”也随时准备扮演分配给他的发明者的角色(尽管他不是)。
——查尔斯·马瑟,电影的出现27
我是在托马斯爱迪生的美国英雄故事中长大的,所以我很惊讶地发现它没有通过历史的考验。电影历史学家戈登·亨德里克斯 (Gordon Hendricks) 于 1961 年在一本书的书名《爱迪生电影神话》( The Edison Motion Picture Myth ) 中率先开场。在开头的段落中,亨德里克斯陈述了他的第一个目标:开始“清理美国电影开篇就充满了精心编织的传奇的泥潭的任务”。他的第二个目标是“为 WKL Dickson 所做的工作提供一些迟来的功劳”。后来的美国电影史家,在亨德里克斯仔细研究的基础上,稍微缓和了他对爱迪生的攻击,同时保持对迪克森的重视。就在不久前,在国会图书馆工作多年的电影专家保罗·斯佩尔终于写了第一本关于威廉·肯尼迪·劳里·迪克森的学术传记。尽管 Spehr 提到了“爱迪生无情甚至邪恶的一面的问题”,但他认为爱迪生的商业行为与时俱进。然而,爱迪生的遗体与我小时候所认为的英雄形象相去甚远。28
爱迪生喜欢被称为门洛帕克的巫师,美国公众欣然接受。他为发明和商业创造了良好的环境。新泽西州门洛帕克是爱迪生传说中的实验室之一。渴望的年轻发明家蜂拥而至与他合作。他是他的实验室和他自己的出色营销人员,他很高兴成为那里实际从事这项工作的所有发明家的化身。而且他赚了很多钱。当他的发明者不能胜任这项任务时,他的商业伙伴购买了其他人的专利,用爱迪生的名字代替了他们的名字,并粉碎了专利法庭的竞争。他的一些最初天真的发明家——尤其是迪克森——终于注意到他们在学分中的持续遗漏,并与他们的赞助人分道扬镳,有时并不友好。
与苹果联合创始人史蒂夫乔布斯的逐句相似之处令人鼓舞。他周围也正在迅速形成一个精心编织的传奇泥潭。在被苹果公司赶下台后,他在加利福尼亚州门洛帕克附近的红木城共同创立了他的第二家公司 Next。他出售 Next to Apple 让他重新获得了 Apple 的认可,他通过出色地推销其热切的年轻创造者的发明和设计(他声称这些发明和设计是他自己的)而著名地扭转了局面。这些声明不一定是直接的,但就像爱迪生一样,当崇拜的公众或他自己的营销部门将功劳分配给他时,他从不否认功劳。他用专利打败了他的竞争对手,赚了很多钱。我们可以很容易地称乔布斯为西门洛帕克的巫师,因为他建立了一个富人,
例如,乔纳森·艾夫(现在的乔纳森·艾夫爵士)设计了 iMac、iPod 和 iPhone。不是乔布斯。但乔布斯确实与艾夫密切互动,并大力支持他。这些设备来自双方以及许多其他人的努力。当然,乔布斯是营销苹果产品的天才——该公司的强尼苹果种子。但是,像爱迪生一样,他推销的主要产品之一是他自己的神话。正如本书所阐明的那样,将一项复杂的技术成就仅仅归功于一个人总是错误的。29
迈布里奇是另一位伟大的营销人员——担任约翰尼·苹果籽的角色。凭借出色的表演技巧,他在全球范围内推销了投影电影的概念,尽管他自己没有一个足够先进的系统来利用这种兴奋他制作了。他的推销给爱迪生留下了特别的力量。这让爱迪生开始思考一种更好的电影制作方式。
两人于 1888 年在迈布里奇的多次巡回演讲中见过几次面。这个想法是将迈布里奇改进的魔术灯,Zoöpraxiscope,与爱迪生流行的留声机产品结合起来——并获得有声照片。迪克森随后的工作表明,这不是一个经过深思熟虑的想法。事实上,成功的有声照片在几十年内都不会出现。但这是个好主意。30
爱迪生很快推断出迈布里奇的方法——即使忽略音频组件——也不可行。迈布里奇没有一台合理的电影机器。一方面,爱迪生很清楚,一旦最初的快感消失,一部只有几秒钟的电影就不会奏效。因此,他立即着手草拟一个更好的主意。字面上地。他向美国专利局提交了一份粗略的草图——当时正式称为警告的一部分——作为一种占位符,打算稍后提交专利申请。尽管这是一个非常有缺陷的想法——例如,百叶窗在哪里?——但它仍然是引发这项发明的火花。31
该草图展示了一种将电影与留声机结合起来的不同方式。当时的爱迪生留声机沿粘土圆柱曲面周围的螺旋轨道录制声音,就像绕在线轴上的线一样。对于电影,爱迪生建议在轨道上录制一系列微小的图片。当圆柱体旋转时,人们可以通过瞄准圆柱体表面的放大镜看到一连串变化的图像。有了这个设备,可以说爱迪生萌生了偷窥秀的想法。声音不在画面中——至少在几十年内。
爱迪生(以他的“发明的拿破仑”姿势,图 5.11,左)将完成这幅素描的工作分配给了迪克森(以他的“放肆”姿势,图 5.11,右)并开始了欧洲的盛大之旅。因此,在爱迪生实验室工作的迪克森主要负责创建某种电影系统,与原始草图几乎没有相似之处。它有一个照相机,Kinetograph,它使用长条胶卷——而不是串在圆筒上的小图片。但它没有投影仪。取而代之的是窥视秀,或称nickelodeon——一种名为 Kinetoscope 的单人观看设备。“爱迪生”活动电影放映机系统几乎是电影系统,但比迈布里奇的设备更接近现代电影。它对世界产生了巨大的影响。
迪克森不得不与爱迪生分离,以创建一个完整的电影系统,并配备一台投影仪。分手并不友好。至少可以说,迪克森和爱迪生的关系是矛盾的。但并非总是如此——即使是在 1895 年,电影真正开始的那一年。32
图 5.11
我相信,在接下来的几年里,通过我自己和迪克森、迈布里奇、马雷和其他无疑将进入该领域的人的工作,这部大型歌剧可以在纽约大都会歌剧院上演,而不会发生任何实质性的改变。原创,并与早已死去的艺术家和音乐家合作。
——托马斯·爱迪生,约。1894 33
托马斯·阿尔瓦·爱迪生 (Thomas Alva Edison) 的传记是为了响应根深蒂固的公众利益的需求,即爱迪生的辉煌发明所唤起的,为了解这位最伟大的在世发明家的个人和生活而创造的需求。
—WKL 和 [妹妹] Antonia Dickson,托马斯·阿尔瓦·爱迪生的生平和发明,1894 年34
他经常只使用他的首字母 WKL,但他的家人称他为 Laurie。他当然从来不是威廉、威尔、比尔或比利。事实上,他有一种让土生土长的美国人反感的形式。四个名字!为什么,那是彻头彻尾的自大。这确实让爱迪生感到困扰,他通过刻意拼错自己的姓氏来刺痛他作为狄克逊。他的一位同事称他为——并不是出于尊重——威廉·肯尼迪·劳里·迪克森的“尊贵的”。35
历史学家——即使是那些赞扬迪克森成就的人——都认为他在装腔作势,自我夸大和夸大事实。甚至他最初的司仪亨德里克斯也列出了迪克森说过的 50 个已知谎言。迪克森通过以下自传加剧了沮丧和不信任,这对美国人或门洛帕克的同事来说听起来不太可能:36
威廉·肯尼迪-劳里·迪克森出生于法国,在英国接受教育。他的父亲詹姆斯·迪克森(James Dickson)是一位杰出的英国画家和平版画家。许多艺术家在他的祖籍中都有编号,其中包括伟大的霍加斯。他的母亲是苏格兰柯克库布赖特伍德霍尔的伊丽莎白·肯尼迪-劳里小姐,她是一位才华横溢的学者、音乐家,并以她的美貌而闻名。她是麦克斯韦顿劳瑞家族的后裔,在著名的民谣“安妮劳瑞”中永垂不朽,而斯特罗万的罗伯逊家族则与卡西利斯伯爵、阿索尔公爵和皇家斯图亚特家族有联系。37
但是,事实上,大部分都是真的——即使是皇家斯图亚特的部分。他的许多祖先家族的数百年血统都记录在英国的经典贵族名录中,伯克的地主贵族和伯克的贵族。他的四个名字继承了他的大部分血统。他的父亲有两个直系祖先威廉·迪克森(William Dickson),还有两个直系祖先叫威廉·贝利·肯尼迪·劳瑞(William Baillie Kennedy Laurie)和威廉·肯尼迪·劳瑞(William Kennedy Laurie)。所以这四个名字对他都很重要。
然而,他一直在自传中遗漏的内容是有启发性的。像他的远亲伊丽莎白巴雷特布朗宁一样,迪克森来自加勒比奴隶主家庭,他们靠着成千上万的奴隶靠甘蔗发家。因此,1879 年迪克森 18 岁时随母亲移民到美国,这并不奇怪,他们首先居住在美国南部弗吉尼亚州里士满附近,很快他就在那里娶了一个旧邦联家庭的女儿。他在余生中一直对家族过去的广泛奴隶制保持沉默。38
迪克森是一个贵族,可能是傲慢的法国出生的英国人,有南方倾向和奴隶制的过去,并不是一个真正的美国传奇。然而,爱迪生似乎从霍雷肖·阿尔杰(Horatio Alger)小说的书页中走出来,成为卖报纸谋生的孩子,然后继续发明电灯泡和留声机,最终成为电影背后的美国天才。这是为爱迪生创造的神话,他很高兴地扮演了这个角色。但事实并不支持它。
迪克森,而不是爱迪生,设计并制造了第一台成功的电影摄影机,Kinetograph,被称为 Edison(当然)Kinetograph。其他人帮助他完成了这项任务,尤其是约翰·奥特。流程图没有传达迪克森整体贡献的深度。例如,他还设计并制作了第一部电影工作室。它被称为黑色玛丽亚(以稻田车命名),位于新泽西州奥兰治的爱迪生公司场地,靠近门洛帕克。而且他制作了许多最早的电影——从 1890 年到 1903 年,其中有 300 多部。他的电影一定很短,一分钟左右,无声,黑白。它们是纪录片——关于一名男运动员、拳击手、一艘进港的船、一场战斗、一位教皇、一位国王、一家理发店。他是一个软件人,也是一个硬件人,尽管没有惊天动地的电影成就。电影的伟大叙事艺术尚未到来。39
图 5.12
迪克森和奥特提出的另一个爱迪生警告草图成为“爱迪生”活动电影放映机。尽管有范围后缀,但这不是投影仪。这是一种向一个人播放电影的设备——窥视秀。爱迪生的商业伙伴非常成功地将他的设备带入了窥视秀行业。纽约市展览中心的插图(图 5.12)说明了一切——一直到迎接顾客的爱迪生古铜色半身像和两条白炽灯挂在墙上的龙。40
事实上,偷窥节目推迟了爱迪生进入电影界的时间。当迪克森建议他们为公开放映制作一台投影仪时,爱迪生拒绝了这个想法。他不想蚕食他在偷窥秀上的成功。他的不情愿有两个主要后果。首先,他的公司迟到了完整的电影系统。到 1895 年,也就是投影机年,其他几个团体拥有了投影仪,其中一个,法国的 Lumière 兄弟,将成为非常重要的竞争对手。其次,他把迪克森丢给了一家对投影仪感兴趣的公司。在爱迪生,迪克森帮助另外两个团队设计投影仪并开展业务。他离开加入其中之一。该集团后来成为了 Biograph 公司,将成为爱迪生在美国电影业最严重的竞争对手。
Edison 的业务合作伙伴很快意识到他们需要一台投影仪来补充 Kinetograph。迪克森退出了爱迪生的圈子,他们需要到别处寻找投影仪。查尔斯·弗朗西斯·詹金斯(Charles Francis Jenkins)和托马斯·阿马特(Thomas Armat)于 1895 年开发了 Phantascope 投影仪,因此爱迪生的商业特许经营者(诺曼·拉夫和弗兰克·金蒙)购买了它的权利,将其更名为 Vitascope,并通过商业合同压制了发明者的名字。最后,还有一个完整的“爱迪生”电影系统,包括主要由 Dickson 和 Ott 开发的 Kinetograph 摄影机,以及主要由 Jenkins 和 Armat 开发的 Vitascope 放映机。爱迪生系统以门洛帕克巫师的名字命名,但这不是巫师所做的——除了他最初为相机部分绘制的不可行的警告草图和对 Jenkins-Armat 机器的一些小修改。爱迪生发明电影的意义就这么大。在实际开发“爱迪生”系统的四个人中,迪克森将在他的有生之年获得更高的声望,但不会声名鹊起。41
重要的是,流程图中没有,迪克森几乎独自负责爱迪生(品牌)电影系统的电影部分。他是开发类似于最近的胶片系统的人——宽度约为 35 毫米的双孔胶片,每帧有四个矩形穿孔。这是电影史上一个极其困难和根本性的发展,在无胶片数码光中逐渐变得不重要。迪克森是征服卷轴到卷轴赛璐珞电影和创建投影仪的主要参与者。42
有一种信息丰富的方法可以打破流程图所代表的难解之结:连接线表明,除了 Armat-Jenkins Vitascope 之外,Dickson 参与了 Yanks 的每一个开发项目。虽然不那么明显,但他也间接参与了 Franks 的许多开发: Lumières 构建他们的系统是为了直接响应“爱迪生”活动电影放映机。迪克森完善的 35 毫米穿孔胶片格式被 Gaumont 和 Pathé 采用。英国的罗伯特·保罗(Robert Paul)制作了一部活动电影放映机,并将其卖给了百代。我们将在 Franks 部分重温 Lumières、Gaumont、Pathé 和 Paul。
迪克森咨询了两个非爱迪生团体关于投影仪的问题。在他还在爱迪生正式工作的同时,他也在一边做这件事。历史学家无法确定这些是否是道德追求。迪克森显然相信他的行为是光荣的,但爱迪生认为他的行为是背叛。65 岁的迪克森在 1926 年写信给爱迪生,“真相终将浮出水面——这提醒我,关于我对你不忠的旧谣言偶尔会出现,除非你否认,否则永远会阻碍进步。”爱迪生在信上写了一张便条:“他不忠。我认为我们最好不要回答,”并归档。43
迪克森的第一个课外小组是莱瑟姆一家,他们有一对父亲和两个儿子,还有爱迪生的前雇员尤金·劳斯特。Lauste 为爱迪生实验室的 Kinetoscope 做出了贡献。迪克森在莱瑟姆家族的角色可能只是建议性的。无论如何,他从未接受过公众的信任。Lauste 帮助创建了 Eidoloscope 投影仪,或者一些人认为。这是电影史上有争议的观点之一。无论如何,它在 1895 年 4 月首次公开展出(原名 Panoptikon)。它的首次商业亮相于 5 月开始,使其成为世界上第二台上市的放映机——紧随三月 Lumières 的电影放映机——也是第一台上市的放映机。44
那一年,1895年,确实是电影史上奇迹的一年。Lathams 不仅在 5 月展示了 Eidoloscope 商业化,而且 Jenkins 和 Armat 在 10 月展示了 Phantascope,这是有史以来的第二个商业化投影。爱迪生的主要特许经销商 Raff 和 Gammon 将 Phantascope 重新命名为“Edison”Vitagraph。法国的 Lumières 很快在 12 月推出了第四次商业放映,即他们的 Cinématographe。(德国团队的 Max Skladanowsky 在 11 月用他的 Bioskop 拍摄了第三次商业放映。)因此,1895 年确实是突破性的一年——我们所知道的完整电影开始的那一年。比赛开始了。45
迪克森与爱迪生的决裂也是如此。从此以后,迪克森因爱迪生否认他的功劳而受到伤害。在 71 岁时,迪克森终于可以写道:“自从爱迪生和伊士曼去世后,我在许多论文和期刊中看到,我在爱迪生制作第一部电影和当今电影的开创性工作受到赞誉。” 46
1895 年,迪克森正式与爱迪生分道扬镳,加入另一个课外团体 KMCD 辛迪加。K 是 Elias Koopman,M 是集团的首席商人 Harry Marvin。C 是 Herman Casler,他成为了 Dickson 的首席设计师和建造者,Dickson 是 D。这群人每年都去纽约北部的一家水疗中心结识,然后一起创造并销售了一个噱头相机——一个侦探相机装在看起来像怀表的东西里。朋友们结成了一家对电影业产生深远影响的公司,但对间谍活动没有令人难忘的影响。47
卡斯勒当然听从了迪克森的建议,设计了该小组的相机 Mutograph。然后,两人将 Mutograph 改装成投影仪。他们称其为 Biograph,该公司以 Biograph 公司而广为人知。迪克森知道如何绕过爱迪生公司的专利,因此 Biograph 成为爱迪生在美国最严肃的竞争对手。48
电影史流程图的右侧是另一个团队——法兰克人。一眼就能看出主要参与者之间的紧密联系网络。他们的故事与 Yanks 的故事一样复杂、强大和令人担忧。我们从 Étienne-Jules Marey 开始。他占据了爱德华·迈布里奇为洋基队担任的弗兰克斯队的鼓舞人心的电影前职位。事实上,马雷和迈布里奇在 1895 年投影仪年之前的几年里相互影响。
马雷知道马的四个蹄子可以同时离开地球。在他知道迈布里奇为 Leland Stanford 的赛马拍摄的著名照片之前,以及在他自己成为像迈布里奇一样的时间摄影师或计时摄影师之前,他就知道了这一点。Marey 和 Muybridge 实践的计时摄影术是前电影摄影术——在完整的电影系统存在之前。
马雷通过非摄影测量了解蹄子。大约在 1873 年,他使用安装在真马蹄上的设备进行了真正的生理测量。他在次年发表的一篇科普文章中对此进行了描述。Marey 一直认为自己是一名科学家,而不是摄影师。这在他的故事中很重要,尤其是关于一位年轻的助手 George Demenÿ——一个真正的门徒——他将把他带到他在巴黎的生理实验室。49
迈布里奇、马雷和斯坦福在早期就相互了解。大约在 1872 年或 1873 年,迈布里奇在加利福尼亚拍摄了第一张四蹄离地照片,但它消失了。这可能不是很好,因为在阅读了 Marey 的科普文章之后,斯坦福聘请了他再次这样做——而且这次可能是正确的。1878 年,马雷直接敦促迈布里奇为他的马静止图像“动画化”。1881 年,马雷在对巴黎的盛大访问中为迈布里奇举办了招待会。50
但是方法上有很大的不同。迈布里奇在帧中捕获,但马雷在条形中捕获。图 5.13 是 Marey 艺术的一个很好的例子——他认为这是科学。他的设备在本质上是一个单一的、非常宽的胶卷上记录了多次曝光。(我已经修饰了顶部的背景。)
电影的神话之一是,在爱迪生看到马雷使用条带后,他从拧到圆柱体上的帧升级到记录在条带上的帧。但爱迪生在 1889 年前往法国之前就已经知道脱衣舞了。事实上,迪克森可能已经在旅行前向他展示了带有胶片的实验性活动摄影机。然而,在他从凯旋之旅回来之后,爱迪生又画了另一幅粗略的素描,作为另一个专利局的警告,描绘了脱衣舞电影沿两个边缘的穿孔。又是迪克森,他会从这个单纯的想法中煞费苦心地创造出 20 世纪电影的电影格式。51
图 5.13
1890 年,马雷获得了计时胶片相机的专利。这是一台在无孔赛璐珞胶片上间歇记录的相机。那年晚些时候,他在科学院展示了一部来自该设备的电影——当然是一匹小跑的马!据推测,他忠实的助手 Demenÿ 是这一发展的一部分。我们现在见到了法国发明家团队,并发现了这个 Demenÿ 是谁。
正如 Demenÿ、Latham 一家、Armat 和 Jenkins 已经意识到的那样,电影业的诞生离不开一系列背叛、可疑的妥协和背后的利刃。
——劳伦特·曼诺尼, 《光与影的伟大艺术》52
Lumières 获得了所有荣誉,其中大部分是应得的。但是还有其他法国发明家和商人,他们中的许多人在职业生涯的不同阶段一起工作并互相“借鉴”。Étienne-Jules Marey 指导 Georges Demenÿ。Demenÿ 与 Leon Gaumont 合作。Henri Joly 借鉴了 Demenÿ 的想法,然后起诉了 Gaumont。Joly 与后来抛弃了他的 Charles Pathé 合作。这是他们的故事。
Cinématographe Lumière 的概念存在很大的混乱。两兄弟在后来的生活中讲述了许多不同的版本——在不同的时间混合了不同的说法,每个人都宣扬自己声称将功德归于自己的说法——以至于真相完全被掩盖了。. . . 雪上加霜的是,卢米埃尔的档案已经消失了。永远不会有像戈登·亨德里克斯那样梳理西奥兰治档案馆的机会来重新确定爱迪生电影放映机发明的真相。
——劳伦特·曼诺尼,光与影的伟大艺术53
他们的名字在法语中是光的意思,这真是太棒了——考虑到历史学家 Laurent Mannoni 对他们的信任度的看法,这真是太讽刺了。Lumières 是一个父亲和两个儿子,就像 Yank Lathams 一样。父亲安托万·卢米埃尔有大儿子奥古斯特和小儿子路易斯。收到的故事干净优雅:两兄弟在各方面都互相钦佩和支持。他们设计了一种单一的、优雅的仪器,Cinématographe,它既可以用作摄影机,也可以用作投影仪。他们首次公开放映了电影院,并引发了电影革命。难怪法国人为他们感到骄傲。但正如本书中的许多故事一样,所接受的故事几乎可以肯定是一个精心设计的创世神话。
曼诺尼的题词对故事中兄弟般的支持部分撒了谎。但毫无疑问,兄弟俩确实展示了一款既是相机又是投影仪的优雅设备。从某种意义上说,它是可逆的,一台设备既可以读取也可以写入胶片,既可以拍摄又可以投影。此外,他们的Cinématographe 也是一台胶片打印机。它真的是一个完整的电影机在一个盒子里。兄弟俩,尤其是 Louis,在与工程师 Jules Carpentier 的密切合作下慢慢完善了它。
乍一看,Cinématographe 似乎是一个简单的设备,但当您阅读 Louis 和 Carpentier 之间交换的许多信件时,这种简单的优雅就变得清晰起来。日复一日,路易斯描述了一些小问题和改进,卡彭蒂尔找到了解决方案并提出了其他建议。完美主义令人惊叹。Lumières 不想在他们的设备绝对完美之前出现在付费观众面前。他们等到生产了 200 台机器后,才于 1895 年 12 月 28 日在巴黎正式推出该机器——这是世界上第四个商业投影,也是欧洲第二个商业投影。
当我们查看竞争者的日期时,首先要求索赔的推动似乎几乎不合时宜。比狡辩的日期更重要的是 1895 年产生的热情,当时大西洋两岸每个月都会宣布和演示新的投影仪。我们可以简单地通过使用或不使用形容词“商业”来改变顺序。第一个和第二个商业预测——即对一个付费公开——发生在美国,Lathams 于 5 月首次发生,Armat 和 Jenkins 第二次发生在 10 月。第三和第四次成功是在欧洲:11 月德国的 Skladanowsky 获得第三,12 月法国的 Lumières 获得第四。
但是放弃“商业”这个词,Lumières 成为第一个公开放映电影的人。1895 年 3 月 22 日,他们在巴黎向数百人展示了一台不太完美的机器。凭借这项公开但非商业性的措施,Lathams 排在第二位,仅在一个月后的 4 月 21 日,他们就向媒体公布了他们的 Eidoloscope。Lumières 也位居第三,7 月在巴黎举行了另一场演出,有 150 人参加。从这个角度来看,当他们在 12 月正式上市时——有付费观众——只有 33 人。54
毫无疑问,Lumières 将一个盒子设想为一个完整的电影系统。但莱昂-纪尧姆·布利也是如此,早一点。1893 年,他获得了一种相机-投影仪组合系统的专利,也称为 Cinématographe。但他因不支付(或无法支付)年费而让专利失效。这使得 Lumières 可以自由地使用这个名称,也许还可以使用基本设计。目前尚不清楚神秘的 Bouly 在 Lumière Cinématographe 的开发中扮演了什么角色(如果有的话)。他不是收到的故事的一部分。55
不幸的是,Lumières 优雅的盒装电影理念并没有被新兴行业所采用。他们的电影格式也不是。他们自己的同胞 Léon Gaumont 和 Pathé 兄弟 Charles 和 Émile 通过采用 Dickson 的 35 毫米胶片系统,即未获得专利的“爱迪生”系统,帮助终结了他们的厄运。尽管如此,Lumières 在早期的美国市场上竞争激烈。他们当时的规模很大——而且在法国大众的想象中仍然如此。56
Georges Demenÿ 这个名字出现在电影史流程图中的几个关键位置。然而,像 WKL Dickson 一样,很少有人听说过他。但他在那里,在某种程度上与几乎所有法兰克球员都有联系——马雷、卢米埃尔、高蒙、乔治·德贝茨和亨利·乔利。美国历史学家保罗·斯佩尔为迪克森所做的,法国历史学家洛朗·曼诺尼为德门所做的。Mannoni 是巴黎著名的法国电影资料馆的电影技术策展人,他将 Demenÿ 带回了历史意识。Demenÿ 的故事充满了失望、失败和肮脏的待遇。57
Étienne-Jules Marey 是 Demenÿ 在长达十年的协会中的大师、导师和父亲形象。两人的关系始于 1880 年左右。1882 年,马雷在意大利度假时将他的生理实验室的管理权交给了他信任的弟子。58
但随着时间的推移,Demenÿ 从事计时摄影业务的商业冲动与 Marey 进一步推动生理学的科学动力发生了冲突——这是计算机中臭气与塔裂的回声。Marey 于 1889 年开始警告 Demenÿ 他对这个方向的不满。但 Demenÿ 坚持了下来,到 1893 年这种关系破裂了。他在一封信中提到了 Marey 的“衰老和不连贯的管理”。在马雷要求他辞职后不久。Demenÿ 基本上被解雇了——“被木星的霹雳击倒”是他自己的措辞。这是Demenÿ的第一次重大失败,他与Marey的关系将进一步失望。
如前所述,Demenÿ 可能帮助 Marey 开发了 Marey 在 1890 年获得专利的计时胶片相机。但这个设备很粗糙。它必须是——没有穿孔以确保恒定的帧速率。Demenÿ 利用这一经验建立了自己的计时摄影机。但他的设备不仅仅是从 Marey 实验室借来的。特别是,Demenÿ 的设备有一个“打手”机制,这是他自己的关键设计。他于 1893 年在英国、1894 年在法国和 1895 年在美国为打浆机机构申请了专利。这是一种凸轮,解决了将胶片的连续运动与间歇使用相匹配的棘手问题。胶片平稳地离开投影机的源卷轴,到达投影镜头和照明。然后收卷轴将投影后的胶片顺利收起。但是电影在放映的那一刻通过间歇性的运动保持静止。如果什么都不做,间歇运动会不断地从源卷轴上猛拉胶卷,或者收卷轴会从间歇运动中拉出胶卷。打手通过有节奏地控制松弛来防止这些压力。59
在后来的几年里,马雷指责德门ÿ窃取了他对(德门ÿ)计时码表的功劳。这种指责似乎有些牵强。马雷本人承认,预打浆机的设计是公开的,是科学的一部分。Demenÿ 的过错在于他没有遵守科学信用的标准做法。不邀请 Marey 参与部分建立在共同开发基础上的企业肯定是一个心理错误——尽管 Marey 摆出纯粹的科学家的姿态。Demenÿ 对 Marey 的指控的回应加倍强调:Marey 是,他说,“一个生病的老人,没有思想,充满怨恨。” 60
1895 年,Demenÿ 与 Léon Gaumont 签约,以利用他新改进的 Chronophotographe 相机(不带投影仪)。Gaumont 的第一个动作是将机器的名称改为 Biographe。他们的交易在 1896 年进行了修改,以适应Demenÿ 计划对 Chronophotographe/Biographe 进行改进,使其可翻转——既是相机又是投影仪,是一台成熟的电影机。Demenÿ 最终在 1896 年完成了这项工作。然后他在 1897 年将胶片格式转换为穿孔 35 毫米,即“爱迪生”格式,以使机器具有完全的竞争力。但到那时,Demenÿ 在 Gaumont 手中遭受了他的第二次重大失败。61
这是“乔利事件”的结果。Charles Pathé 购买了一部“爱迪生”活动电影放映机,并需要电影胶片。他从盗版了该设计的英国人罗伯特·保罗那里获得了副本。保罗可以自由地做到这一点,因为爱迪生未能在欧洲为电影放映机申请专利。但是百代不能很好地与爱迪生公司联系,为一台本质上是盗版的机器购买胶卷。因此,百代在 1895 年与法兰克人的发明家亨利·乔利达成协议,为盗版的活动电影放映机制造一台照相机。Joly 是一个不错的选择,因为他了解 Marey 和 Demenÿ 以及他们的工作。为了这项任务,Joly 制作了他的 Cinématographe——Cinématographe Joly——并将其制成可翻转的投影仪。他给了它一个直接从 Demenÿ 拿来的打浆机机制,这使得接下来发生的事情特别令人讨厌。
Joly 有胆量起诉 Demenÿ 的搭档 Gaumont。他的律师明确承认,Joly 改进了 Demenÿ 的机制。然后他开始命令 Gaumont 停止生产 Demenÿ 机器。棘手的论点似乎是 Demenÿ 的机制是 Joly 专利改进的一部分,因此 Joly 的专利也涵盖了 Gaumont 机器。这很荒谬,但 Gaumont 对法律纠纷的回应是抛弃 Demenÿ!毫不奇怪,Demenÿ 永远为自己没有得到应有的荣誉或奖励而苦恼,他就这样死去——名誉扫地。Joly 也同样被 Pathés 甩了,这对他来说并没有什么安慰。62
Joly 注意到 Charles Pathé 仅将 Cinématographe Joly 用作摄影机。Pathé 被 Edison 困在了偷窥的心态,并没有利用设备的投影功能。因此,乔利开始四处寻找能够理解投影所提供业务的人。例如,他与乔治·德·贝茨(George de Bedts)讨论了各种可能性——他曾是德梅尼的众多同事之一。Pathé 的紧张是可以理解的,但他的下一个动作是仓促的。他只是将乔利和他的妻子踢出他提供的设施,同时在他们搬出时将乔利的相机藏起来。那是在 1896 年,正值电影业蓬勃发展的时候,使用投影。Pathé 和爱迪生一样,后来才意识到窥视秀是一条死胡同。他很快找到了一台可逆投影仪并开始做生意,最终成为电影界最成功的电影之一。我们不知道 Pathé 实际使用的是什么机器。也许是乔利的。无论如何,Pathé 将 Joly 赶下台,就像投影业务一样Joly 所敦促的实现了盈利——没有补偿,也没有原型机。乔利试图与另一个合伙人一起创业,但失败了。63
Demenÿ 的第三次失败是由 Lumières 带来的,他们强烈否认他声称他影响了他们的 Cinématographe 设计。这就是可爱的 Lumière 故事开始崩溃的地方。近几十年发现的 Demenÿ 草图显示了一种间歇运动机制,该机制使用由偏心凸轮移动的一对爪子——这是对 1895 年电影摄影机的描述。路易斯·卢米埃在参观时看过这些图纸,尽管承认这些图纸显示了更粗糙的机制Demenÿ 在 1894 年 12 月。64
Demenÿ 也出现在流程图的 Yanks 一侧,一些历史学家认为他应该在那里得到更多的信任。1895 年,詹金斯和阿马特在后来的“爱迪生”Vitascope 投影仪中使用了打浆机。美国专利局宣布它是从 Demenÿ 借来的。迪克森团队可能也将它借用于传记投影仪,但历史陪审团仍然对此不以为然。当时流行的摄影文献描述了 Demenÿ beater 的专利,所以这已经不是什么秘密了。65
对 Demenÿ 的描述有足够的柔和和不确定性,表明他可能无法与天才迪克森相提并论。然而,他不应该被遗忘。他参与的太多,认识太多的球员,并且对电影机器的一些根本性改进负责——也许比我们知道的要多。
到 1907 年,爱迪生公司拥有美国电影摄影机的一项主要专利,并通过不断的诉讼来行使这项专利。终于筋疲力尽,爱迪生的竞争对手向公司寻求救济。解决方案是 1908 年电影专利公司的诞生,有时也称为爱迪生信托公司。大约 10 家公司将他们的专利集中在一起,并作为一个团队进行竞争。该集团包括法国公司 Pathé 的美国分公司和当时最大的胶卷供应商伊士曼柯达公司。甚至爱迪生最大的竞争对手迪克森的传记也加入了。爱迪生无法抗拒的传记投影仪专利是使信托如此有效的原因。如果这听起来像垄断勾结,那是因为它是。66
声称爱迪生信托导致好莱坞诞生的说法过于强烈。这似乎是合理的,因为加利福尼亚距离总部位于新泽西的爱迪生公司还有很长的路要走。毫无疑问,信托基金发现很难在这种情况下追踪和行使专利。但更重要的西海岸福利是充足的阳光、廉价的劳动力和房地产。许多独立电影制片人搬到了那里。例子有环球影城,它在 1912 年成立后不久就搬到了好莱坞,还有派拉蒙影业,于 1912 年在那里成立,它们今天仍然在好莱坞。这两个 Yanks 的制片厂加上 Gaumont 和 Pathé for the Franks 是世界上现存的五个最古老的电影制片厂中的四个。(第五是丹麦的诺德电影。)
偏远的好莱坞位置并没有保护环球影城。无论如何,爱迪生信托基金紧随其后。但在 1917 年,美国最高法院以滥用专利为由裁定该信托基金不成立。最后,在 1918 年,爱迪生信托被终止为根据谢尔曼反托拉斯法非法限制贸易。67
这样就完成了电影流程图诞生的扩展标题。现在我们专注于电影的那个特殊分支——动画电影——在我们的讲述中,它导致了数字大融合。通过 Digital Light 有很多途径,但我最了解的一条是通过角色动画。
□ □ □
我们已经区分了数码灯的一半像素和制作像素的一半。到目前为止,从现实世界中提取像素来代表现实世界已经占据了我们的大部分时间。现在让像素代表虚幻世界成为我们的重点。
一旦我们了解了计算机内部的几何模型如何成为创建虚幻世界的帧流中的像素帧,那么我们将足够了解游戏的工作原理,以及虚拟现实 (VR)、增强现实 (AR) ),以及所有应用程序和互联网的所有用户界面。我们在 3D 数字角色动画中使用的相同基本原理解释了它们。特别是,它们都共享一个正在显现的计算机内部的不可见模型的概念。在拍摄和制作之间,我们掌握了完整的数码灯。
现在我们开始着手制作数字光的像素部分——尤其是数字电影。让我们从电影界经典二维角色动画的简史及其工作原理开始。这为我们提供了角色动画所需的语言。然后我们在后面的章节中应用计算机强大的放大功能来达到所有的数字光。
动画向我们展示了运动中的一些自然惰性的东西,我们从中得到的本质上是对魔法的满足。
——唐纳德·克拉夫顿,在米奇68 岁之前
因此,摄影机,乔治·华盛顿的机器,最终被证明是个骗子。
——Ashton Stephens,一位评论家在看过 Winsor McCay 的Gertie the Dinosaur (1914) 69
动画电影的存在时间与电影本身一样长,至少从 1895 年的发明热潮开始。但它们是什么?
定义它们很棘手。经典电影取材于现实世界。布景和服装可能是虚构的,灯光是人造的,演员扮演的角色可能是虚构的,但它们都是现实世界的一部分。这并不明显,但手绘动画电影的帧也来自现实世界。在卡通动画中,例如迪斯尼的《白雪公主和七个小矮人》(1937 年),每一帧都是一幅图画的照片或一幅虚幻世界的图画。那些图画或绘画是现实世界中的对象。因此,区分动画电影的不是虚幻与真实。
区分他们的不是制造与接受。只有被称为纪录片的小类别声称拍摄现实世界本身。大部分电影都是虚构的。大多数电影的每一帧,无论是否动画,都是在用相机录制之前精心制作的。
正如漫画所暗示的那样,这也不是二维对三个维度。一些所谓的定格动画电影从真实的三维世界中获取每一帧。以雷·哈里豪森 (Ray Harryhausen) 的经典作品Jason and the Argonauts (1963) 中跳舞的骷髅为例。或者任何我喜欢和孙子们一起看的现代小羊肖恩(2007 年至今)剧集。一些最早的动画电影是定格动画,或者至少是间断动画——例如乔治·梅里爱的《闹鬼的城堡》(1896 年)或詹姆斯·斯图尔特·布莱克顿的《闹鬼的酒店》(1907 年)。一些最早的非动画电影是展示一位艺术家绘制二维卡通的电影——例如埃米尔科尔的幻想曲(1908 年)和温莎·麦凯的小尼莫(1911 年)。这些所谓的闪电素描不是动画电影——只要可以看到艺术家的身体——尽管有二维内容。
这些电影说明动画片段或镜头经常以各种方式与非动画片段混合在一起。动画电影和他们的动画师是延伸的 Yanks vs Franks 电影奥运会的一部分。70
因此,区别动画电影的不是卡通与摄影现实主义。这在数字光的新世界中变得尤为明显。计算机动画帧现在可以像真实世界的照片一样具有丰富的逼真细节。
如果这些东西都没有将动画与非动画电影区分开来,那又是什么呢?这是时间的利用。虚幻的时间,而不是虚幻的空间,定义了动画电影。动画电影与实时无关。我们称所有其他真人电影为真人电影,因为从根本上说,它们与生物一样受时间的奴役。约翰·韦恩 (John Wayne) 穿着刺耳的牛仔装大步穿过西部片场,占据了一个虚构的精心制作的空间,但他的动作被实时记录下来。
这可能看起来不对。众所周知,电影是导演或剪辑师及时自由排序或重新排序的一系列镜头。当然,自由地重新安排时间与被时间奴役相反。但请记住,每个镜头都是连续视觉流的时钟采样。它是现场的或实时的动作。
早期的电影只是一种奇观——嘿,看看这个,现在看看这个——一个喷嚏,一场拳击比赛,一个诱人的舞者,教皇。迪克森在 1900 年左右的许多电影都是这种类型。在电影开始之后不久,剪辑的力量的发现改变了这一切。编辑打乱了时间。我们可以以任意的时间顺序一起编辑电影片段——每个片段都有自己不可阻挡的内部时间。每个片段或镜头都是实时的奴隶,但镜头的顺序不是。有了这种自由,编辑器会导致感知时间加快或减慢。百年可以在一瞬间过去。
千年也是如此,如2001 年:太空漫游(1968 年),它著名地从一根骨头棍子跳到了宇宙飞船上(图 5.14)。猿猴向上投掷骨头。随着相机不断地向上和向上,它缓慢地翻滚。. . 它在空间站 V 附近变成了形状大致相同的地球卫星,这是一个雄伟的旋转中转站,供人类前往月球。导演斯坦利库布里克的“比赛剪辑”瞬间跨越了整个人类历史。
剪辑的力量来自于叙事和情感。由此产生的软件就是我们称之为“电影”的艺术形式。比喻说,无数可能的程序在我们的大脑上进行计算。
动画电影将剪辑发挥到了极致——每帧一个。时间不再是限制。没有视觉流程可供采样。下一帧通常是动画师打算在未来 24 秒内拍摄的当前帧,就好像它是从视觉流中实时记录的一样。但不一定是这样。它发生在动画师创建的虚构时间,可能很少或没有与实时的关系——或者是对采样实时的精确模拟。
图 5.14
因此,动画电影的世界正在争夺中。它可以像艺术家希望的那样抽象。任何顺序的任何形式都是允许的。到了极限,抽象动画——纯粹来自任意视觉的情感创造,就像音乐来自任意声音一样——是等待莫扎特、肖邦和斯特拉文斯基的伟大艺术形式之一,但一直有一些实践者。著名的例子是 Walter Ruttman 的Lichtspiel: Opus I (1927) 和 Oskar Fischinger 的Motion Paint No. 1 (1947)——纯粹的视觉音乐。71
科尔不是外行。相反,他正在成为一个偏执狂,并将他的余生致力于推动动画作为一种艺术和产业。他最有责任将他的前辈们的努力转化为一种独特的 20 世纪艺术。
——唐纳德·克拉夫顿,在米奇72之前
与真人电影的奇观时代一样,动画电影也经历了早期的进化阶段。起初有特技电影,比如斩首或魔术。导演使用中断帧之间时间的能力来说服我们一个人失去了他的头,或者茶壶在跳舞。法国的乔治·梅里爱(Georges Méliès)也许是最著名的早期戏法电影大师——例如《月球之旅》( A Trip to the Moon,1902 年)。在普通镜头中使用了剪辑,以使我们相信不可能实时发生的事情。正是在镜头中与时间的混战使特技电影成为动画的一部分。
继特技电影之后的是以主持人本人为主角的闪电小品,他本人就是导演。他会继续在黑板上作画,显然是实时的,然后画出的人物就会“栩栩如生”。就好像导演不愿意承诺制作完整的动画,或者无法相信它会真正起作用——观众会得到它。或者他们不愿意让自己远离聚光灯。闪电素描者会向观众展示他在做什么,或者如何理解正在发生的事情。格蒂恐龙(1914)是一个著名的早期例子。温莎·麦凯出现在屏幕上,指着一张大纸上的风景。他把格蒂从她的洞穴里叫出来。当她出现时,她变成了自己的生命——一个新的意识中心,就像一个新生婴儿。所以格蒂是一部真人电影与动画电影的插曲。73
Émile Cohl 对法兰克人来说就像温莎麦凯对洋基队一样,因为他是最早的动画师之一。但两人却截然不同。动画历史学家唐纳德·克拉夫顿(Donald Crafton)将科尔描述为聪明而内向,而麦凯则描述为善于交际的主持人和华丽的表演者。因此,几乎没有人知道科尔也就不足为奇了,尽管与麦凯相比,他制作了数百部电影。此外。Cohl 是一群不连贯的艺术家,他们专注于将精神错乱作为一个美学问题——不完全是一个受欢迎的事业。尽管如此,他的由 Gaumont 发行的Fantasmagorie (1908) 可以说是第一部动画片,克拉夫顿称他为第一位动画师。但他为麦凯保留了最重要的头衔:第一位角色动画师。74
几分钟后,麦凯让观众相信他已经复活了一只可爱而有形的动物——这是动画师作为生命给予者的胜利时刻。
——唐纳德·克拉夫顿,在米奇75之前
动画电影的神奇灵魂在于我们所说的角色动画,这是从迪士尼的《白雪公主》(1937 年)到皮克斯的《玩具总动员 4》(2019 年)等最常见和最受欢迎的动画电影必不可少的现象。手绘角色——如白雪公主中的邪恶女巫——以速度投射时似乎在移动。到这个时候,这应该不足为奇。如果样本制作精良,这正是采样定理所保证的。更重要的是——也是神奇的——动画师的技能使移动的角色变得生动起来!它有良心,做出决定,并感到痛苦——或给予痛苦——或说服我们无论如何它都会这样做。那个狡猾的 Road Runner 又一次比那个笨拙的 Coyote 更聪明。这种魔法并非来自采样定理。这是艺术,我们还无法解释。动画不仅仅意味着移动。它的意思是鼓舞人心。阿尼玛是拉丁文风,空气,呼吸,生命的原则,灵魂。这是自然惰性变得不那么惰性的魔力——不是惰性,但更重要的是,不是死的。
动画电影历史上的一个重要时刻是第一个真正的角色动画的放映——受到启发,而不仅仅是动人。可以肯定地说,它发生在电影早期的某个时候。克拉夫顿在题词中暗示,这件事发生在 1914 年,麦凯和他的恐龙格蒂。在那一刻,角色与屏幕上的创作者断绝了关系。观众可以相信会得到它——意识到动画角色是独立的。不需要笨拙的解释。你可以省略明确的人类教育者。
然而,观众是否会明白这一点并不明显——灵感动画应该奏效。我们甚至不知道它是什么。我们也不知道动画师是如何做到的。他们也没有。同样,我们不知道演员是如何让我们相信他们不是他们自己的人。事实上,这两个观察结果是相互关联的。动画师的技能与演员的技能相同。一个演员让我们相信他或她的身心与另一个完全不同的人不同。一位动画师让我们相信,一堆无生命的图画——或者数百万个多边形,就 Digital Light 而言——是有生命的和有意识的。皮克斯根据动画师的表现来雇佣动画师。
作为 1950 年代的孩子,当沃尔特·迪斯尼本人在他的每周迪斯尼乐园电视节目中解释动画制作过程时,我感到非常激动。他描述了一项名为cel动画,下节详述。Cel是赛璐珞的缩写,实际上只有一个“l”。当我在 1970 年代初自学动画时,是 cel 动画。当我在 1970 年代中期从专业人士那里学习动画时,他们教的是 cel 动画。当我和我的同事在 1970 年代后期开始以数字方式实现动画时,我们采用的方法是 cel 动画的数字等价物。而当我们在 1980 年代后期第一次为迪士尼公司实现二维动画时,又是 cel 动画。因此,我认为 cel 动画是唯一的动画技术也就不足为奇了。但是我错了。76
在 20 世纪之交的早期,埃米尔·科尔(Émile Cohl)采用一种称为剪纸的技术,将他的卡通人物的拼接剪纸放在背景上。一个不透明的切口位于绘制的背景上。例如,科尔可能已经抬起角色的脚准备迈出一步。拍摄了一个框架,然后重新定位切口 - 例如,膝盖略微下降,并且随着步骤的进行,脚趾更直接地对准地板。这本质上是基于定格摄影的二维动画。77
在早期的另一种技术中,称为slash and tear,动画师会在背景绘图中切出一个洞,以露出下面一堆绘图的最顶部。然后在拍摄完一帧后,他或她撕下顶部的图画以显示角色的下一个位置,如通过背景中的孔看到的那样。法裔加拿大动画师 Raoul Barré 使用了这种技术。它是 cel 动画技术的唯一重要竞争对手。78
竞争技术的一个重要原因是对 cel 动画专利的大力捍卫。负责将动画建立在坚实的商业基础上——准备好维持对真实电影行业产品的永不满足的需求——的人是约翰·伦道夫·布雷。他了解专利的力量,并着手开发我们现在称为 cel 动画的大部分内容,并于 1913 年为其申请了专利。但他未能将透明赛璐珞的关键理念——cels 纳入其中。纸是他的主要材料。79
Earl Hurd 在 1914 年申请了专利,确定了我们所知道的 cel 动画过程。但布雷和赫德并没有在法庭上解决分歧,而是达成协议,共同追求他们的想法,作为布雷-赫德进程。布雷总是把这个过程归功于自己,但很明显赫德的专利才是真正的关键。然后他们追捕那些没有从他们那里购买许可证的动画行业的人。因此,以较小的方式,布雷和赫德将制作爱迪生信托对真人电影的动画。80
将苹果浸入啤酒中
让沉睡的死神渗透
——邪恶的女巫,白雪公主(1937)
由于 cel 动画导致了 Digital Light,我们将详细讨论它。凭借 cel 动画技术,Ub Iwerks 和沃尔特迪斯尼创立了一系列将角色动画带入大时代的公司。这是用于制作迪士尼白雪公主(1937 年)的技术,这是第一部成功的长篇动画电影——这部电影可能暗示艾伦·图灵死于毒苹果。81
一旦你听到它的细节,cel 动画技术似乎很明显。这就是为什么,我怀疑,我们中的许多人对此一无所知。Cel 动画使用摄影来捕捉一系列图像。一位摄影师在一个特殊的“相机架”上放置了一个背景场景,该场景是由背景艺术家在不透明材料上绘制的,作为第一层或最底层。然后他在上面画了一个透明的赛璐珞,上面画了一个角色——一个完整的赛璐珞。这两层通过作为相机支架一部分的金属钉进行严格的注册。沿每层顶部打的孔接收这些钉子。然后他放下另一个 cel,上面有另一个彩绘字符,在第一个之上。等等。将所有前景字符都对准背景上方,并紧紧地靠在背景上,他为堆栈拍了一张照片。相机看到堆栈形成的合成图像。那是电影的一帧。摄影师为电影的每一帧重复这个费力的过程——从下往上——因为每个角色通常在帧之间移动一点。对于一部长片,他这样做了多达 130,000 次。
为了首先创建每个单独的 cel,动画师使用铅笔在纸上绘制分配给他的角色,就位。在随后的每幅画中,他的角色都会轻微移动。每张纸都具有规定尺寸,并在其顶部打有用于登记钉的规定孔。然后一张透明的赛璐珞片,大小相同,打孔方式相同,用钉子牢牢固定在动画师的图纸上方。墨工仔细地在透明的赛璐珞上用黑色墨水在 cel 上描绘铅笔画。
上墨者将每个上墨的 cel 传递给opaquer,它的工作是用彩绘颜色填充被墨迹线包围的区域 - 就像一个拿着蜡笔和着色书的孩子一样,非常小心不要超出线条。遮光剂将上墨的 cel 翻转过来并在其背面上漆,这样油漆就位于正常通过 cel 观察到的上墨线下方。这保留了墨线的质量——它们的变化例如,相机看到的宽度。不透明是使用的术语,因为油漆必须涂得足够厚以阻止光通过细胞。背景层不能通过一个 cel 的着色不透明部分(通过一个字符)或通过另一个 cel 的任何 cel 看到,除非在未绘制的地方。
实际上,每帧有四个或五个 cel 的限制。没有 cel 是完全透明的。每个额外的 cel 层都会导致轻微的光通过透明部分丢失。事实上,不透明者必须在每一层上稍微改变他们的油漆颜色,以适应通过一堆所谓的透明 cels 缓慢增加的不透明度。
不难看出,拥有 130,000 帧的 cel 动画是一场后勤噩梦。假设每帧有四层加上背景。这意味着一部 90 分钟长的电影可能需要跟踪 650,000 个对象。并且必须仔细检查它们中的每一个是否完成,没有错误,并且在框架和分层方面都以正确的顺序进行。上个世纪的动画公司使用精细的手写会计流程来跟踪这些物流——诱人迷人的角色动画的丑陋管道。
从角度来看,Digital Light 可以缓解这两个问题,即一堆 cel 中不透明的累积和丑陋的物流任务。在数字动画中,透明度是完美的。细胞数量没有限制。不透明度累积不是动画中的固有问题,仅在基于 cel 的模拟动画中。但物流是内在的。幸运的是,计算机非常适合这项吃力不讨好的但基本的任务。
动画师必须为电影放映的每一秒创建和组合 24 帧,但早期的动画师实际上经常“在 2 秒上拍摄”。也就是说,他们每秒只创建 12 帧,但每帧拍摄两次以获得必要的 24 帧。他们会偏离这种做法,只针对快速移动的序列。“2s 射击”减少了物流,减少了一半的制作工作,但制作的动画更加不稳定。
早期的动画师开发了一系列技巧来弥补由此产生的低时间采样率以及每一帧实际上是静态的这一事实。检查这些非凡的技巧很有启发性和乐趣。主要的是挤压和拉伸,以及预期和夸张。它们是由完全不了解采样定理但深刻理解人类感知和讲故事的动画师创作的。
考虑一下低弹球,通常是初学者的第一个动画。当一个真正的球弹起时,它所遵循的抛物线曲线的高度会降低。在撞击的那一刻,一个真正的球会轻微变形。球越软,变形越大。如图在图 5.15 中,每个帧时间的一个球显示了该时刻样本的样子。请注意,反弹发生在采样时刻,恰好在该帧时间。因为动画师可以选择他们的采样时间——他们不受时间的影响——他们总是选择那个确切的时刻作为帧。
图 5.15
请记住,任何电影的每一帧都会被投影两次以避免闪烁。这意味着即使在最好的情况下——用 1 秒而不是 2 秒射击——弹跳球的每个位置都会在视网膜上投射两次。但是当动画师在 2s 上拍摄时,每一帧都会重复两次。这意味着在 2s 上拍摄的每一帧都会在视网膜上投影四次!考虑撞击时的框架。视网膜会四次分别看到该帧。然而,大脑设法感知到一个单一的影响时刻。这怎么可能行得通?采样定理中没有任何东西可以处理这种情况。
此外,反弹的时刻是视觉流中的一个尖锐“边缘”。在频率峰值中,该边缘具有非常高的频率,需要以远高于每秒 24 次的速率进行采样——当然也远高于 2 秒拍摄中隐含的每秒 12 帧。根据采样定理,正确的做法是通过四舍五入方向的急剧变化来消除高频。但这不是动画师所做的。他们想要那种锋利的边缘,所以他们夸大了时刻——最高频率变化的时刻。再说一次,这怎么可能起作用?现在应该清楚的是,动画师也与物理学脱节,但不知何故被他们的经验所引导。
图 5.16
图 5.16 是两位大师弗兰克·托马斯(Frank Thomas)和奥利·约翰斯顿(Ollie Johnston)的弹跳球课程(模型),这两位大师是迪斯尼极具天赋的九个老人——该公司动画电影成功的秘诀。我的电脑效果图很难表现出他们迷人的铅笔素描,尤其是在撞击的那一刻。
众所周知,弗兰克和奥利在他们的标题中表示,顶部更近的间距是实验的结果。实际上,如果路径以相等的时间间隔进行采样,这正是情况的物理要求,如前面精确执行的插图所示(图 5.15)。
他们歪曲现实以“给人一种弹跳的感觉”。请注意图 5.16 的下半部分,球是如何向接触点伸长(伸展),在接触时变平(压扁),并在接触后在框架中缓慢放松的伸展。这说明了壁球和伸展,但也说明了对事件的预期(在反弹发生之前伸展),以及对反弹和后续的夸大。用弗兰克和奥利的话说,这些技巧“让行动更加迅速”。这些技巧改善了观众的主观、感知“现实”。82
事实上,弗兰克和奥利在每一步都改进了它。将图 5.16 中的上图(没有挤压和拉伸的弹跳)与图 5.15 进行比较。两张图片都是为了展示同样的东西,一个真实发生的弹跳球。但是弗兰克和奥利,摆脱了现实世界的物理联系,摆脱了重力及其抛物线——也摆脱了采样定理——画出了一个已经比物理上正确的反弹更丰富和更充分的反弹。然后他们改进了壁球和拉伸的改进。请注意,他们的样本并不完全位于正确的位置,并且球并不完全遵循真正的抛物线。而且撞击瞬间的变形(在他们的实际图纸中更加古怪)与实际变形几乎没有关系。它更像是一个装满水的弹性袋,而不是一个橡皮球。
他们声称,弗兰克和奥利凭直觉发现了如何克服弹跳球采样中的缺陷。为什么这些非凡的技巧会如此有效?有人怀疑它一定与采样过程有关。由于我们并不真正知道大脑如何从呈现给视网膜的样本(尤其是四倍样本)中重建动画,因此我们必须猜测它们为什么起作用。动画师似乎在他们的样本和帧中打包了人类大脑的丰富提示。弹跳前后的细长球在运动方向上拉长。这对大脑来说是一个很大的暗示,就像标准电影帧中的运动模糊一样。
击球时球的夸张变形一定会让大脑充满戏剧性的信息。动画师保持了球的感知体积——保留了一些工作中的物理概念。但他们夸张地垂直压扁球并水平拉伸——有时几乎变成了煎饼。当这样的序列快速回放时,弹跳的球是流动的、有趣的、松软的——动作很快。球具有您可以感觉到的重量和可变形性。动画师通过夸大挤压和拉伸来控制我们的情绪。明显运动的现象并不能完全捕捉到发生的事情。表观变形更像它。
我最难忘的与期待、夸张、挤压和拉伸的相遇发生在我用电脑掌握 3D 动画的时候。这个1970 年代中期在长岛,当时计算机还很简陋。我将左手建模为一个简化的骨架,由用于骨骼的小圆柱体和用于关节的小球体组成。我什至手腕有 8 个腕骨(如腕管综合症)——8 个小球体。如果你不仔细看,它的效果出奇的好。
我复制了左手并将其镜像,给了我右手。复制和镜像对于计算机来说非常容易。两只手,现在我该怎么办?我可以制作什么动画?当我拍手时,我仔细观察了我的两只手。自己做这个,你会注意到你的手掌之间的距离只有几英寸左右。当手掌合在一起时,一只手的手指在另一只手的食指或小指周围略微弯曲。一只手的拇指在拇指或另一只手的手掌周围略微弯曲。动作是僵硬的——手掌分开,手掌合拢。即使使用当时粗糙的工具,它也很容易实现。
但是很无聊!它是无菌的。我突然想到,这正是壁球和伸展、预期和夸张的目的,旨在缓解。它们旨在改善感知的“现实”。他们应该为这个新的 3D 动画工作,就像他们为旧的二维 cel 动画所做的那样。在这两种情况下,结果都是人类查看的二维帧。
因此,我将手向后弯曲到手腕处——不可能向后弯曲,如图 5.17 所示。我夸大了那个动作。我通过先将它们分开来预测双手合拢的动作——向后移动以强调向前移动。那是期待。然后我双手合十。我夸大了速度。当双掌合十,突然停住的时候,手指却没有。他们伸出了刚刚经过的手掌——难以置信的远,夸张的远。然后他们缩回到一个自然的位置。当它们伸展时,它们的尖端也会膨胀,然后它们会在它们缩回到自然位置时塌陷到自然形状。我对两组手指和两个拇指都这样做了。有很多伸展,但没有太多的壁球。
当我快速播放这个动画时,结果很好吃!一双又大又肥又邋遢的拍手,看起来还活着,让我感觉很好。让我对大师们充满感激。
手工绘制动画电影的每一帧都是一项艰巨的苦差事。为什么不拍摄真人演员,然后勾勒出他们以获得动画卡通片?这种被称为转描法的捷径概念被多次改造。爱德华·迈布里奇(Edward Muybridge)让一位艺术家将那匹著名的小跑马的每一帧复制为墨迹、绘画或剪影。因此,我们建议我们应该将他视为转描法之父,而不是(真人)电影之父。
图 5.17
Cinémathèque française 的 Laurent Mannoni 向我展示了两个从电影开端开始的短片循环。其中一个由显然是乔治·梅里爱表演技巧的相框组成。另一个循环来自 1897 年的德国,使用了从第一个循环衍生的手绘框架,每个循环都是相应相框的彩色卡通画。83
但该工艺的美国专利于 1917 年授予 Max Fleischer。他开始使用该工艺制作他著名的 Ko-Ko the Clown in the Out of the Inkwell动画1915 年的系列。他的兄弟戴夫为相机表演了 Ko-Ko 精心编排的动作。然后马克斯用他的旋转镜架从每一帧中提取出一幅卡通画。一台投影仪从后面将戴夫的每个真人画面放大到一个透明的画架上。Max 在画架上安装了一个 cel,位于投影图像上。然后,他在 cel 上描绘了 Dave 的卡通轮廓,制作了动画电影的框架。Max 和 Dave 都声称是这个想法的始作俑者,但他们的说法相互矛盾。正如我们所见,这可能无关紧要,因为无论如何他们肯定不是第一个提出这个想法的人。但他们确实有效地利用了它。Dave 曾在 Pathé 工作,但最终还是 Bray 发布了Out of the 1919 年的Inkwell,无疑很高兴将转描过程置于专利控制之下——就像 cel 动画一样。84
Dave Fleischer 在 Digital Light 中扮演了一个角色,但他从来不知道。Dave 和 Max 成立了 Fleischer Studios,以许多动画电影而闻名,包括大力水手电影。一位年轻的动画师约翰·真蒂莱拉(John Gentilella )参与了由戴夫在麦克斯去世很久之后制作的菠菜包装大力水手( Spinach Packin' Popeye ,1944)。然后,化名 Johnny Gent,他领导了Tubby the Tuba (1975) 的动画,该动画是在 Alexander Schure 拥有的纽约理工学院校园内使用老式 cel 动画制作的。85
Schure 聘请 Ed Catmull 和我(以及其他人)将一台数字计算机整合到 Johnny 的动画制作过程中。Ed 负责前景轮廓动画,我负责动画轮廓的颜色填充和背景绘制。我们前进的速度不够快,无法帮助Tubby,但我们和纽约理工学院计算机图形实验室的其他成员确实开发了最初的想法,这些想法后来成为 - 经过多年和大量改进 - 数字 cel 动画系统 CAPS(计算机动画制作系统)在迪士尼。
Ed 和我(以及其他人)于 1980 年左右加入 Lucasfilm。在那里,迪士尼与我们接洽,希望我们将他们的 cel 动画流程数字化。我与迪士尼就 CAPS 合同进行了一年多的谈判。此后不久,我和 Ed 于 1986 年共同创立了 Pixar,我们将 CAPS 带到了一起,并在两家公司的共同满意和钦佩下完成了。CAPS 一直使用到 2006 年沃尔特迪斯尼公司收购皮克斯。约翰尼·根特和他在纽约理工学院的团队在 1970 年代教会了我们全尺寸 cel 动画的复杂性,这构成了我们与迪斯尼的关系的基础,达到了大约 30多年后,迪士尼收购了皮克斯。
你会注意到,当 Ub 和 Walt 在动画行业摸索他们的路时,他们只能通过对获得发行和寻找资金的前景极其天真地生存下去。他们一直在被剥削,一直被欺骗,没有什么能阻止他们。
——Russell Merritt,引自The Hand behind the Mouse 86
沃尔特·迪斯尼正在成长为一个有魅力的领导者和有远见的人,他的说服力并没有在乌贝身上消失。
— Leslie Iwerks 和 John Kenworthy,鼠标背后的手87
是时候讲述非常有影响力的迪斯尼公司的故事了——即使是不漂亮的部分。沃尔特·迪斯尼 (Walt Disney) 于 1901 年 12 月 5 日出生于芝加哥,原名沃尔特·埃利亚斯·迪斯尼 (Walter Elias Disney),在服役一段时间后,他搬到了密苏里州堪萨斯城。Ub Iwerks 出生于Ubbe Eert Iwwerks 于 1901 年 3 月 24 日在堪萨斯城,1924 年他将自己名字的拼写改为 Ub Iwerks。我为他使用这个别名,就像我为其他人所做的那样,因为这是他在完成他最伟大的工作时使用的别名。两人受雇于堪萨斯城的同一家商业艺术公司,很快成为了好朋友。88
大约一年后,两人都被解雇了,所以他们成立了一家公司,Iwwerks-Disney Commercial Artists。他们考虑将其命名为 Disney-Iwwerks,但一致认为这听起来像是一家眼镜公司。没关系,因为公司很快就倒闭了,于 1920 年破产。这两个朋友随后受雇于堪萨斯城电影广告公司。就在那时,他们发现了动画世界——并疯狂地爱上了它。
他们吞噬了迈布里奇著名的定格动画人和动物光栅阵列,并从各个帧中制作了活页簿。他们从 Edwin G. Lutz 的有影响力的书Animated Cartoons (1920) 中学习了动画制作工艺。他们学会了刀耕火种、墨水和油漆。他们学会了转描。他们研究了赫德、麦凯和弗莱舍一家。而且,当然,他们还得亲自动手制作一部动画电影。Ub 天生的机械天赋帮助他们实施了先驱者的系统并做得很好。他们没有受到专利问题的困扰,因为他们远离了堪萨斯城的聚光灯。89
沃尔特很快就将自己定位为这对搭档的谈话者、营销者和组织者。例如,他说服堪萨斯城电影广告公司的老板借给他们一台定格相机供课外使用。沃尔特把它安装在他家的车库里。然后,他、兄弟罗伊和朋友乌布开始下班后制作动画短片。
闪电草图的想法启发了他们的早期作品之一。他们拍摄了沃尔特的手,然后迅速将那只手移到一幅画上方。那只手似乎在画画。他们很快就从这些作品中组装了一个演示或演示。其目的是支持沃尔特销售一系列短片的营销工作。堪萨斯城弗兰克纽曼剧院连锁店的经理买下了这个系列的想法,所以他们把这部短片命名为 Newman Laugh-O-grams。其中一个卖女士长筒袜,这部电影主要是因为他们使用的一位名叫 Lucille Fay LeSueur 的漂亮模特,别名 Billie Cassin,别名——在她的职业生涯后期——琼·克劳馥。另一个取笑当地街道的坑洼。
正如这些作品所暗示的那样——以及 Newman Laugh-O-grams 这个名字强烈暗示——沃尔特、乌布和罗伊的目标是娱乐,而不是广告。但他们在堪萨斯城电影广告公司的老板不支持朝这个方向扩张。如果你想娱乐,那就创办自己的公司,他告诉他们。沃尔特正是这样做的。
他对这个想法深信不疑,于 1922 年离开堪萨斯城电影广告公司,创办了 Laugh-O-gram Films。乌布留在后面。他需要稳定的收入来支持他的母亲。沃尔特通过为新公司达成分销协议迅速解决了这个问题。这似乎为 Ub 提供了他需要的安全保障,因此他做出了飞跃并重新加入了 Walt。但他犯了一个错误。第二家公司也破产了。Ub 重新加入堪萨斯城电影广告公司。沃尔特搬到了罗伊兄弟现在居住的加利福尼亚。90
沃尔特和罗伊在那里创办了一家名为迪斯尼兄弟卡通工作室的公司,这是沃尔特的第三家公司。在 Laugh-O-gram Films 倒闭之前,他和 Ub 已经成功制作了电影《爱丽丝的仙境》。沃尔特用它来宣传——并成功地达成了另一笔分销交易。但在爱丽丝系列中的七条短裤交付后,经销商查尔斯·明茨给沃尔特发了一封带有明确信息的起泡信。他们必须立即提高质量。因此,沃尔特在 1924 年写信给 Ub,恳求他在加利福尼亚加入他们。而乌布做到了。爱丽丝的品质电影明显改善。沃尔特停止了动画。制作将是他永远的强项。Ub 成为该工作室收入最高的动画师,并于 1924 年正式化名为 Ub Iwerks。迪士尼兄弟工作室继续制作了数十部爱丽丝电影。
迪士尼兄弟的下一个系列以兔子奥斯瓦尔德为基础,像往常一样由 Ub 创建和动画。但随后发生了一件令人讨厌的事情。他们的发行商 Mintz 暗中雇佣了迪士尼兄弟的所有动画工作人员——除了忠实的 Ub Iwerks——还剥夺了 Oswald the Rabbit 的版权。
米老鼠就是在这个可怕的时刻诞生的。沃尔特要求乌布换一个新的主角来代替奥斯瓦尔德,乌布设计的这个角色将成为全世界迪斯尼的象征。91
他们秘密制作了后来成为疯狂飞机(1928)的电影,这是第一部由米老鼠主演的电影,Ub 担任联合导演(与沃尔特一起)和动画师。然后他们创作了他们的第一部有声电影《汽船威利号》( Steamboat Willie,1928 年),由 Ub 担任导演和动画师(图 5.18 是标题卡文本的模型)。这两部电影都取得了成功,并继续成为经典。接下来是The Skeleton Dance (1929),Ub 担任动画师,Walt 担任导演。这是该公司 75 首愚蠢交响曲中的第一首。乌布导演了本系列前七部中的四部,沃尔特导演了另外三部。作为工作室的负责人,沃尔特是所有这些电影的制片人。92
一切似乎都很好,但事实并非如此。
Walt 开始摆弄 Ub 的动画时间——他对采样时刻的选择——动画感觉的秘密。沃尔特会不经询问就改变它们。沃尔特开始用力骑乌布,同时从他身上夺走功劳。很明显,迪斯尼公司已经成为沃尔特迪斯尼的全部——事实上,这最终将成为它的名字。
众所周知,压垮 Ub 的最后一根稻草或许就是这件事:一个派对上的一个男孩让沃尔特为“他的”著名的米老鼠画画并签名。沃尔特转向乌布并说,“你为什么不画米奇,我会签的。” Ub 回击道:“画你自己的——米奇!” 那是 1929 年。他们一直在一起,就像他们认为的朋友一样,已经有 10 年的大部分时间了。乌布决定他必须去。沃尔特从朋友变成了暴君。营销变得比发明更重要。93
图 5.18
重新开始的最佳时机可能不是在 1929 年的崩盘之后,但那年晚些时候,Ub 被联系到这样做。一位名叫帕特鲍尔斯(Pat Powers)的商人是迪斯尼的竞争对手,他资助他成立了一家新公司。鲍尔斯将乌布的决定告知沃尔特,并向震惊的沃尔特暗示他并没有失去乌布——如果他愿意与鲍尔斯达成协议的话。“我不要他,”沃尔特苦涩地回答。“如果他有这种感觉,我永远无法和他一起工作。”
1930 年 2 月,Ub 成立了 Ub Iwerks Studio。在接下来的十年里,这是 Ub 的生活。一系列基于他最新角色 Flip the Frog 的电影是新工作室的主菜。但是,尽管制作了数十部电影,Iwerks 工作室却从未蓬勃发展。到 1936 年,它不得不关门大吉。在那之后出现了溅射和开始,但到了 1940 年Ub 厌倦了制作,而是想为这种艺术形式做出贡献。只有一个工作室能让他做到这一点。他重新加入了沃尔特——但条件完全不同。94
图 5.19
(左)© Sharon Green/Ultimate Sailing。(右)© Doug Gifford。
可悲的是,华特迪士尼公司的故事不再包括 Ub 的基础角色。他被写出来了,显然是沃尔特和罗伊相信他们的朋友乌布在他们与白雪公主创造动画历史的那些年里抛弃了他们的代价。但一旦他回到迪斯尼,乌布就重新确立了自己的地位,尤其是在技术问题上,如果不是在沃尔特和罗伊的心中的话。95
当 Ed Catmull 和我在 1970 年代中期开始每年秘密前往迪斯尼朝圣,为电脑动画寻找资金时,沃尔特和乌布都已经去世(1966 年和 1971 年)。但 Ub 的良好声誉仍然完好无损。他的儿子 Don Iwerks 在那里继承了他父亲的传统。那里的技术人员向我们保证,“Ub 会”支持我们提出的想法——将迪士尼 cel 动画流程数字化。沃尔特的侄子(和长得相像)罗伊·爱德华·迪斯尼(图 5.19),沃尔特的兄弟罗伊·奥利弗·迪斯尼的儿子,Pyewacket的船长,最终将在大约十年后实现这一目标,成为 CAPS 项目的冠军。再过两年,他将为迪士尼收购皮克斯扫清道路。96
我给了菲利克斯一个个性,使用了许多面部表情。. . . 他会是一只宠物。. . . 他会影响年幼的孩子。. . . 他会满足很多愿望。. . . 回首过去,我们看到一扇门在通往视觉艺术新领域的道路上微微打开。
——Otto Messmer,唐纳德·克拉夫顿在米奇97之前的前言
对我来说,老鼠是一件令人厌恶的事情。
——Otto Messmer,在米奇98之前的题词
在 Pat Sullivan 和 Otto Messmer 中有 Walt 和 Ub 的回声。他们的产品是Felix the Cat,一个仍然深受动画爱好者喜爱的角色和系列。Messmer 做了动画(图 5.20)。沙利文是推动者和震动者,变得富有,并获得了荣誉。
图 5.20
菲利克斯在抽象动画和卡通人物动画之间占据了一个特殊的领域——比如带有大量现实主义的超现实主义。在适当的时候,他的尾巴可能会变成问号或感叹号。他的耳朵会像剪刀一样咔哒一声。菲利克斯可以用最荒谬的方式解决问题。例如,为了到达没有梯子的高处,他会拆下自己的尾巴,将其变形为阶梯线,然后爬上“楼梯”。
唐纳德·克拉夫顿 (Donald Crafton) 在其权威动画史的封面上庆祝菲利克斯,在米奇之前,并将整个最后一章献给他:“这是 1920 年代的典型动画片。” 它是黑白的,无声的,但它工作并继续工作。99
到 1926 年——在米奇之前——菲利克斯几乎和查理卓别林一样受欢迎。菲利克斯娃娃卖得很好——这是电影推销的早期练习。但声音的缺失最终注定了沙利文的事业。多年来他一直拒绝使用它,直到迪斯尼和艾沃克斯的威利汽船(1928 年)中音频的巨大成功迫使他改变了主意。但后来他选择了劣质的音响系统,到 1930 年,工作室基本上已经死了。
尽管如此,费利克斯还是让沙利文成为了百万富翁——在 1920 年代。他和他的妻子 Marjorie 在爵士时代的神话般的纽约市非常富有。当 Messmer 经营他们的赚钱工作室时,他们酗酒和狂欢。但在 1932 年,玛乔丽从他们公寓的五楼窗户坠落身亡,帕特再也没有恢复完全的情绪稳定。
沙利文的名字是菲利克斯猫系列的名字,而不是梅斯梅尔的名字。但沃尔特当然知道是谁在做这项工作。1928 年,随着Steamboat Willie的成功,他在纽约市期间多次访问了 Sullivan 工作室的 Messmer 。沃尔特开始有远大的想法——一部长篇电影——他需要人才。“他恳求并恳求,”梅斯默说,他对离开纽约市不感兴趣。“而且,看起来菲利克斯可以永远继续下去。他正处于成功的顶峰。” 然而,沙利文很快就失败了,沃尔特独占了整个领域,但他从未签下梅斯梅尔。
我还没有真正解释过电影是如何运作的——尤其是动画电影。就像我们对演员和动画师如何做他们所做的事情一无所知一样,这是因为大脑几乎肯定会参与其中。在动画的一般情况和特殊情况下,这种未知领域是电影技术的极限。一旦技术通过学生,我们就不得不举手——或者做出有根据的猜测。换句话说,到依靠视觉持久性和明显运动的心理物理现象只是另一种说法,“大脑做到了”。
这本书的一个主要主题是采样定理,科捷尔尼科夫的伟大想法,是理解数字光的关键。由于电影似乎以每秒 24 帧的速度对视觉流进行采样,因此采样定理肯定应该解释为什么电影有效。但我们发现它们并非完全那样工作。从抽样理论得出的可爱的理想电影系统并不是实际使用的系统。
实际的系统绝对是某种采样过程,但它每帧投影两次,而且帧很胖,充满了诸如运动模糊之类的线索,供大脑享用。在理想的系统中,框架很薄——瞬时的。因此,它们不能包含运动模糊线索。但它们可以表示任何不超过两倍最高频率限制的运动。采样定理保证了这一点。当我们接近 Digital Light 时,我们将寻找对理想系统的遵守。现代现实世界是否在瞳孔之外传播和添加样本?还是继续依靠“大脑做它”的手波?
动画电影甚至超出了采样定理的范围——尤其是那些用 2 秒拍摄的。在这种情况下,每一帧都被投射到视网膜上四次!考虑弹跳球。它与地面接触的那一刻一次又一次地发生。然而,我们的大脑会弄清楚。它没有看到四重打击,而是感受到了一种持久的美味冲击——毫无疑问,这得益于动画大师的技巧,如挤压和拉伸、预期和夸张。
理想与现实暗示了塔与臭,这是本书的另一个主题。它们从根本上都很重要。事实上,这正是塔与臭的对比,以及为什么将一个人的创造力评价为另一个人的创造力是错误的。真正的电影机器是在臭气熏天的环境中创造出来的。我们可以稍后在象牙塔中出现,并提出一个美丽的数学想法来“解释”电影机器工作的原因。但很明显,电影发明者并不是从理论开始的。采样定理不能解释他们的机器。但它确实告诉我们下一步该走哪条路。这种行为和思考的相互作用比理论家或工程师通常愿意承认的更接近世界的运作方式。
电影和动画的故事也生动地让我们想起了电影技术的另一部分秘密,一个我们更不了解的秘密。沙利文和迪斯尼业务的关键在于他们聘请了具有稀有艺术天赋的人来使照片栩栩如生。这也是在数字世界中有效的方法。我一生中最好的雇佣是迪斯尼训练有素的动画师约翰拉塞特,他莫名其妙的天赋是皮克斯无与伦比的早期成功的无可置疑的关键。
摩尔定律因子现在(2020 年)为 1000 亿X,并迅速接近 1 万亿X。尽管所有关于人工智能和深度学习的主张都受到了计算能力的超新星爆发的启发,但我们现在几乎没有比 1920 年代和 1930 年代更接近于理解动画师或演员是如何创造个性的。根据电视广告,现在所有的汽车都是智能的,但没有一辆汽车能激发一个人物的灵感。
我并不是说技术存在硬性限制——机器不能具有创造力。我个人的信念是,我们总有一天会了解创造者是如何创造甚至是机器的。但那是信仰,而不是科学。如果有足够的理由,我可以选择相信相反的观点——许多人也这样做。声称或暗示我们几乎就在那里,现在任何一天都是“基于信仰的科学”。与此同时,在可预见的未来,我们将继续聘请最优秀的人类艺术人才来制作动画和表演——他们是唯一已知的解决方案。我们仍然在寻找世界上为数不多的 Ubs、Ottos 和 Lasseters。
样条近似包含了普罗科菲耶夫 [原文如此] 古典交响曲的美妙悖论:似乎它可能是几个世纪前写的,但当然不可能。
——菲利普·J·戴维斯,数学家,1964 1
旧金山地区的一大乐趣是轻松享受美妙的音乐。即便如此,当伟大的印度西塔琴演奏家 Ravi Shankar 在 1982 年的一个凌晨时分走进卢卡斯影业的计算机图形实验室时,我还是感到震惊。我独自一人在我们的一位常驻天才编写的绘画程序上工作,汤姆波特。那天晚上我一直致力于了解 Tom 的最新功能——样条曲线。Ravi 的主持人是 Clark Higgins,他是 Grateful Dead 摇滚乐队和我们的视频向导。2
“你认识拉维·香卡,不是吗,阿尔维?”
我融化了。“我当然是了。” 我第一次见到他是在 60 年代的一部决定性电影《蒙特雷流行》(1968 年)中。我知道他曾于 1969 年在伍德斯托克演出,这是那个时代的另一个决定性事件。我不认识他,但我肯定认识他。
拉维是一个漂亮的男人,身材娇小,面带微笑,穿着(大部分)白色印度服装无可挑剔。最重要的是,他身上散发着一种微妙而令人惊讶的香味——一种感性的光环,既增强了他的存在感,又在他站在我的肩膀上凝视时将我吞没。
碰巧在靠近顶部的电脑屏幕上显示了一朵花。前一天一位来访的艺术家在那里画了一朵红色和蓝色花瓣的小花,中心有一个白点。当拉维加入我时,它照亮了房间,就像一朵真正的花一样。
“样条曲线,”我解释说,“是通过几个点的优美曲线。我们的计算机只能记录这条路径上的几个点。” 我做了一个盛大的手势,用手写笔在一个大平板电脑上划过。那天晚上我没说什么。我只是向拉维展示了它是如何工作的。
手势是任意的,从低处开始向上移动。手腕一甩,我在中风时短暂地向下扫过,然后再次向上扫过,最终结束。
然后汤姆的绘画程序立即接管了。首先,它通过平板电脑的稀疏点创建了一条样条曲线。请注意,我们看不到样条曲线。它是纯几何图形,宽度为零,存储在计算机的某个地方。但随后,在稍作停顿之后,程序将其渲染为我们面前彩色显示屏上的一笔画。不可见的样条线成为可见笔画的支柱。我的手势和程序的笔划之间的延迟是如此短暂,以至于似乎——带着一点想象力——我,而不是电脑,直接在屏幕上画了它。颜色是随机选择的——棕色,幸运的是。
该程序模拟了具有柔软边缘和不同宽度的笔触。笔画在显示屏底部附近开始时没有宽度,然后随着向上扫过并进入曲线逐渐变宽,最后在向上结束时再次变窄。. . 只是在花!一个完美的茎。好像我是这样计划的。但我没有。我们三个人都知道我没有。它让我们大吃一惊。在那个漫长的时刻,我的音乐英雄拉维·香卡(Ravi Shankar)和我一起沉浸在他自己的天堂般的气味中,和我一样震惊,他摸了摸我的肩膀,低声说:“Allllllllvyyyyy!”
一群“肥嘟嘟”的鸭子同时站起身来,在它们吵闹的表亲之后向北走。
——亨利·大卫·梭罗,瓦尔登湖,1864 年3
Ravi Shankar 演示的样条曲线是源自同名绘图员工具的几何图形。早在个人电脑出现之前,我父亲就教我机械绘图。这些工具是用于画圆的精密德国罗盘、用于直角和直线的 T 形方尺以及印度墨水笔和笔尖。他有另一个相当神秘的工具,叫做法式曲线(图 6.1),如果你把图片倒过来,它就类似于圣诞老人的雪橇。它的目的是在我们试图绘制一条不寻常的平滑曲线时稳定我们颤抖的手。在插图中,绘图员将法式曲线放置在三个连续的位置,以帮助他分段绘制曲线。这些部分是曲线部分 A、B 和 C,每个部分都位于法国曲线的许多边缘的不同位置。这位绘图员很幸运。他找到了所有需要的曲线沿着圣诞老人的雪橇滑道,彼此靠近。但有时你找不到你所寻找的曲线。
图 6.1
图 6.2
认真的绘图员需要更值得信赖的东西。豪华游艇的设计师不会忍受可能缺少所需曲线部件的法国曲线。例如,为了绘制赛车船体的曲线,他们使用一个用重物固定在适当位置的薄柔性条带,如图 6.2(右)所示。条带通过重物固定的点并通过它们松弛成平滑的曲线,因此条带的边缘可以追踪到船计划中。那个绘图工具——条带和砝码——被称为样条线。4
Ravi Shankar 演示中的几何样条直接受到船设计师的物理启发。出于显而易见的原因,物理版本中的重量被称为鸭子(或鲸鱼)。如图所示,您甚至可以购买画成绿头鸭、秋沙鸭、丑角等的丰满鸭子。从物理鸭子突出的钩尖是物理样条必须通过的点。几何样条只有虚拟鸭子,没有实体或钩子。在这种情况下,鸭子只是样条必须通过的点。在 Ravi Shankar 演示中,鸭子是我做出手势时从平板电脑获得的分离点。
观点值 80 IQ 点。
——艾伦·凯,施乐 PARC,ca。1980 5
样条曲线提供了连接分离点的答案,例如 Ravi Shankar 演示中来自平板电脑的点。它是一条平滑、优美起伏的几何曲线,穿过这些点。这是对它们之间的猜测,附带条件是那里的东西应该很有趣,甚至很漂亮。否则连接点是微不足道的:只需用直线段将每个点连接到下一个点。曲折的结果并不讨大多数人的喜欢。
为了理解样条曲线,我们再次调用,不管你信不信,采样定理。但我们必须采取稍微不同的观点。
我们在关于采样定理的章节中遇到了埃德蒙·泰勒·惠特克爵士,他的名字可能不会响起。他是 1915 年英国采样定理发现者的候选人,比 Vladimir Kotelnikov 早 18 年。他是英格兰最伟大的数学家之一。他曾就读于艾萨克牛顿学院的剑桥三一学院,并于 1896 年成为那里的研究员。1905 年,他被选为皇家学会会员。为了结束他辉煌的职业生涯,惠特克领导了爱丁堡大学的数学系。
然而,我把采样定理的王冠给了科捷尔尼科夫。为什么不是惠特克?有两个原因。首先,他没有从我们在数码光中用于像素显示的角度证明这个定理。其次,即使你接受他的观点,他也没有完全证明目前使用的定理。
Whittaker 的专长是插值。他的观点体现在他与人合着的一本书中:
插值理论。. . 从最基本的方面来看,它可以被描述为“在数学表的行间阅读”的科学。6
数据表对大多数人来说并不是什么漂亮的东西,但它们很方便。假设我们在加州大学伯克利分校的某个特定位置每小时测量一次温度。那么,在任何给定时间后 15 分钟,我们对同一天下午 3 点的温度的最佳猜测是什么?Whittaker 的插值理论产生了一个很好的估计,一个有用的数字。
插值意味着在 之间放置一些东西。定义中隐含的是,它们之间的东西被创建在那里。如果幸运的话,创建的数据可能实际上代表了现实世界——例如,伯克利校园下午 3:15 的温度。它本来是有意义的,就好像它被测量了一样,但事实并非如此。Whittaker 是一位插值大师,或者说是数据之间的创建大师。
Kotelnikov 的对比观点从未包括平滑曲线的创建。他的观点是平滑的重建,而不是构建。他从平滑的曲线开始——比如亮度或响度。他找到了一种方法来丢弃大部分数据以获取一组离散样本(例如像素或索素),然后他可以从中重建原始平滑度。他的采样定理教我们如何做到这一点。
惠特克的观点正好相反。离散数据点是他开始的。他试图找到一个连接它们的平滑事物,这就是为什么他没有证明 Kotelnikov 证明的更强大的采样定理版本(以及 Claude Shannon 重新证明的)。7
正如我们所描述的,Kotelnikov 的最简单形式的采样定理有两个部分。第一部分告诉我们如何对可以描述为傅里叶波之和的平滑事物进行采样——结果证明这是自然界中最平滑的事物。特别是,它告诉我们在该总和中以(超过)两倍的波最高频率进行采样。第二部分告诉我们使用理想的散布器来散布样本并将它们相加以重建原始平滑的东西。换句话说,第二部分告诉我们如何对样本进行插值,通过它们得到一条平滑的曲线,即原始曲线。Kotelnikov 从平滑开始,取离散样本,然后重建原始平滑:从平滑到离散再到平滑。
Whittaker 的插值定理告诉我们用散布器(与 Kotelnikov 指定的理想散布器相同)散布每个给定的数据点。然后将结果相加以获得数据点之间的平滑插值,平滑曲线。该曲线是傅立叶波的总和,最高频率与使用的扩频器一致。回想一下,理想的扩频器与最高频率的波一样频繁地摆动。Whittaker 从离散数据开始,在它们之间插入平滑度,然后沿着原始数据点之间的新曲线发现所需数据:离散到平滑到离散。
尽管有两种观点,但结果在数学上是等效的。一个只是另一个相反。那么为什么不把采样定理归功于惠特克呢?推迟的原因是他没有证明科捷尔尼科夫采样定理的更复杂形式,即现代世界经常使用的所谓带通变体。我们在关于图灵的章节中使用了它,用于他的声码器工作,他打破了包含每秒 0 到 3,000 个周期的音频信号,分为 10 个波段,每个波段的带宽为每秒 300 个周期(0 到 300、300 到 600,...)。
图 6.3
尽管如此,我们在本章中将 Whittaker 冠以插值之王是恰当的。在为计算机图形创建平滑对象时采用 Whittaker 的插值观点和在离散显示中采用 Kotelnikov 的采样观点,这是一个很好的平衡。从两个不同的角度来看,一个基本的想法在两个数字光领域都存在,这一点一点也不明显——惠特克在制作,科捷尔尼科夫在接受。
图 6.3(左)是 Ravi Shankar 演示中来自平板电脑的点的图片。小箭头显示了我手势的方向。平板电脑以相同的时间步长记录了手势,所以你可以看到我一开始画得很快,转弯时放慢了速度,然后很快完成了。右图是我们不要的,用直的点之间的线。这是相同数据的插值,但并不令人愉悦。这是一条僵硬的锯齿形“曲线”。在过去糟糕的日子里,人们认为这就是计算机所能做的一切。在摩尔定律证明它们是错误的之前,他们认为计算机是僵硬的、棱角分明的——简单地说是机械的。在计算机图形学中,线性插值(点之间的直线)几乎是不可取的。8
图 6.4
我们可以做得更好。可以从平板电脑的下边缘垂直测量每个点的位置。图 6.4(右)是每个点的垂直位置图。它只是左侧的点以相等的时间步长水平分布。
我们已经使垂直位置看起来像前面章节中描述的示例。它们不是已知现实的样本,但我们没有理由不能像它们那样行事。让我们用采样定理构建那个虚构的“现实”。请注意,我们说的是构造而不是重构。又是那个观点。我们知道如何进行这种构造:用一个好的撒布器传播每个样本,然后将结果相加。图 6.5 就是你得到的。平滑曲线通过(插值)“采样”垂直位置,位于图片中的扩展器峰值处。该曲线上的点是所需的垂直位置,因为它们会随着时间平滑地变化。
接下来,我们对水平位置重复相同的技巧。结果是一条平滑的曲线,它通过(插值)“采样”的水平位置。该曲线上的点是所需的水平位置,因为它们随时间平滑变化。(本段见在线注释中的实际构造。)
使用这两条曲线,我们可以在任何特定时刻绘制所需的二维空间曲线,即样条曲线:我们从第一条曲线及其与第二条曲线在同一时刻的水平位置。如果我们随着时间的增加有条不紊地执行此操作,那么我们会以与手写笔在平板电脑上的原始手势相同的方向和顺序绘制所需的曲线。也就是说,我们为垂直和水平位置构建了一对平滑曲线,它们穿过或插入 Ravi Shankar 演示的数位板点。这是一种复杂的方式来说明我们已经通过这些点创建了一条平滑曲线。
图 6.5
让我们再过一遍。我们假设通过给定的数位板点有一条平滑的曲线,并且它是原始手势的路径。如果您考虑一下,要实现这一点,沿路径的垂直变化必须平滑变化,水平变化也必须变化。所以我们使用采样定理的重建技术来构造一条垂直位置的平滑变化曲线,以及另一个平滑变化的水平位置曲线。两者都必须经过二维空间中样本点的垂直和水平位置。在笔划期间的任何其他时间,我们都可以简单地从两条构造曲线中读取当时必须位于该路径上的点的垂直和水平位置。图 6.6(右)显示生成的样条曲线与确定它的点(鸭子,左)相比的样子。通过平板电脑的人工输入在左侧,计算机的输出在右侧。它是平滑的,而不是曲折的。这是一条样条线,是 Digital Light 中最可爱的想法之一。样条是一个很好的词。
图 6.6
再看一张 Kotelnikov 和 Whittaker 指定的吊具的图片(图 6.7,顶部)。这是理论上正确的吊具。
但是我们不能将那个理想的扩展器用于我们的样条构造,因为它是无限的。这些涟漪逐渐减弱,但它们会永远持续下去。我们之前在图 6.7(底部)中使用了实用的有限扩展器,并声称它是理想扩展器的“良好近似”。但那是在重建的背景下——Kotelnikov 的领域。在这里,上下文是构造,而不是重构,我们不需要使用理想的、无限的扩展器。我们非常乐意使用更简单、更有限的,吊具。并且近似的概念是无关紧要的。我们准确地构造了一条新曲线,而不是近似地重构了一条已知曲线。
图 6.7
您使用这种更简单的吊具获得的样条曲线已被多次重新发现。在计算机图形学中,它被称为 Catmull-Rom 样条曲线,以纪念重新发现它的两位计算机图形学学生:与我共同创立皮克斯的 Ed Catmull 和 Raphael Rom。9
由于 Catmull 和 Rom 都是从 Whittaker 的插值角度得出他们的样条曲线来构建平滑曲线,他们不会想到它是从 Kotelnikov 样本的重建,也不会认为他们的扩展器是近似于理想的吊具。他们不会想到他们生成的样条曲线的傅立叶频率内容。
这两种不同的用途——创作和展示——来自不同的观点,这就是为什么我把建筑归功于惠特克,把重建归功于科捷尔尼科夫。实际结果是一个吊具可以在两种情况下使用。一个计算机程序足以满足两者。同样的想法在创意空间和展示空间中都很有用,这是一种令人惊讶和美丽的联系。
Ravi Shankar 样条演示是计算机图形学的一个示例,它是 Digital Light 的一个主要分支——一个合成分支,可以制作图片而不是拍摄它们。计算机图形学总是需要两个步骤:我们通过在 Creative Space 中使用不可见的几何图形建模来创建对象,这一过程我将在本章中详细描述下一个。然后我们通过将基于几何的模型渲染到显示空间的散布像素中来查看它们,例如打印页面、手机显示器或虚拟现实 (VR) 护目镜。这就是我们对计算机图形的定义。
在与 Ravi Shankar 合作的那个晚上,Tom Porter 的程序创建了一个不可见的样条线作为笔画的主干。那是笔画背后的几何形状。尽管几何是计算机图形定义的基础,但模型不仅仅是几何。笔画模型还具有颜色、柔和的半透明边缘和随时间变化的宽度。该程序将笔画模型渲染为像素,然后通过卢卡斯影业图形实验室的全彩显示器传播到可见性。这是二维计算机图形的一个例子,因为该模型是基于二维几何的。
本章中同一样条曲线的图片是一个更简单的渲染。它的模型与我向 Ravi Shankar 展示的笔画具有完全相同的几何路径。但是该模型的其他组件是不同的。它是白色背景上等宽的黑线。两张图片都是计算机图形的示例。创意空间中的单个几何对象可以在显示空间中以多种方式呈现,具体取决于那些非几何模型组件。10
另一方面,如果没有几何图形,那么它就不是计算机图形学。Adobe Illustrator 将二维几何模型渲染为像素。这是一个计算机图形程序。Adobe Photoshop 从头开始创建像素或修改从现实世界中获取的像素。它不是计算机图形程序。这是一个图像处理程序,来自 Digital Light 的另一个主要分支。同样,早期的 Apple 提供了 MacDraw(一种计算机图形程序)和 MacPaint(一种像素打包或图像处理程序)。(有关“几何”的广义概念的讨论,请参见注释。)
计算机图形是几何输入,像素输出。图像处理是像素输入,像素输出。两者都用于创建图片。在内存非常昂贵的早期,图像处理只是为了拍照,但摩尔定律使得在新千年的现在,直接从像素制作照片成为可能。
Adobe 和 Apple 产品对反映了我在第 4 章中提到的书法“绕道”造成的旧数字光划分。早期,基于几何的程序设计用于书法显示,而基于像素的程序用于光栅显示。现在使区分变得棘手的是,自从大数字融合以来,这两个品种都以像素显示。计算机图形与图像处理的区别在于其独特的基于几何的创意空间的内容。但是两个分支现在共享相同的显示空间。
有很多二维计算机图形的例子。甚至我现在使用的 Microsoft Windows 界面也是计算机图形。窗户开着显示空间中的屏幕是程序创意空间中桌面上一堆文件的矩形模型。与 Microsoft Word 的界面类似。它的模型是代表文档页面的一系列矩形,页面上的每个字母最终都由一个几何模型定义。网页设计和使用结果页面的浏览器是进一步的例子。几何输入,像素输出。
本书的一个主要目标是展示一部类似皮克斯的电影是如何从计算机中出现的。这种电影的每一帧都用计算机内部的三维几何建模,然后渲染成二维扩展像素以进行全彩显示。这就是我们所说的三维计算机图形学,这本书的主要焦点。电子游戏的创建方式相同。VR 也是如此——每帧有两个显示器,每只眼睛一个,以产生立体效果。
样条曲线是曲线,而不是曲面,我们现在要将注意力集中在曲面建模上。我们考虑的下一个形状用于此目的。其中第一个简单而熟悉。
究竟什么是三角形?我查阅了我在新墨西哥州克洛维斯高中时精心保存的平面几何教科书,这本书塑造了我的整个未来。本书从第 7 页开始,以点和直线开头。这两个概念无法真正定义——我们只是“知道”它们是什么——但我们可以通过它们缺少什么或不具备什么来开始“理解”它们:一个点没有宽度、没有高度和没有厚度。这是纯粹的位置。一条直线没有宽度,没有厚度,并且在一维的两个方向上都趋于无穷大。可以通过命名其上的任意两个点来指定。线段是由直线上的两个点(线段的端点)定义的有限段直线。折线由线段组成,除了最后一条线段外,每条线段都以头尾相连。11
令我惊讶的是,教科书直到第 57 页才到达低三角形。它说,多边形是一条闭合的折线。最后一条线段的最后一个端点连接到第一条线段的第一个端点——没有悬垂端点。最后,三角形是只有三个边的多边形。这些都不是可见的,但教科书确实说一个点由图片中的一个点表示。图 6.8 在一张图中显示了几何课。这些是我刚才提到的五个不可见几何对象的可视化。它们是简单抽象几何模型的具体渲染。
图 6.8
图 6.9
教科书对三角形的冗长方法确实具有引入一个重要术语的优点。它是多边形,计算机图形学中一个非常受欢迎的词。计算机图形学的一般方法是用多边形描述一个虚构的世界。
但是我们将立即摆脱对多边形一词的需求,因为这个关键事实:任何多边形都可以细分为三角形:选择多边形的任何角或顶点,并用线将其连接到所有其他角(顶点)段。所以,我们只需要谈论三角形。图 6.9 显示了将四边形多边形转换为两个三角形的两种不同方法,并带有一条额外的线段(虚线)。五边形多边形需要两条额外的线,依此类推。(注意事项见注释。)12
由于这个技巧,我们只需要专注于由三角形组成的模型。不过,并不是每个模型都可以用三角形制作。Ravi Shankar 曲线的几何模型只是样条曲线,而不是多边形。第一张数码图片“First Light”中的文字,以及“数码之光的黎明”一章中早期电子游戏的游戏板也有简单的模型,并未简化为三角形。除了少数例外,这些模型只是直线段。
但是考虑一下皮克斯的动画电影,从玩具总动员到超人总动员 2、Illumination 的卑鄙的我,以及所有其他具有 3D 角色的动画电影——“皮克斯式”电影。它们的特征是由曲面组成的,曲面可以只用三角形来建模。
如果我们学会了如何处理一个三角形,那么我们就可以让 Amplification(计算机的伟大荣耀)来处理所有其余部分,通常是数百万个。本章(和下一章)的中心思想是,如果你能理解一个三角形是如何从计算机内存到显示屏的,那么通过调用 Amplification您可以直观地了解完整图片是如何进入屏幕的。正是计算机不知疲倦地一遍又一遍地计算同一件事,数百万甚至数十亿次,速度非常快,这使得计算机图形成为可能。这很难做到——对于一个没有帮助的人来说是不可能的——但很容易理解。
图 6.10
几十年来,计算机图形学家通过制作单个物体的图片来展示他们的最新进展。. . 一个茶壶。事实上,正是这个真正的茶壶——图 6.10 是它的照片,而不是计算机渲染图——在计算机历史博物馆中占有一席之地。茶壶属于 Martin Newell,自然是英国人,他是 1970 年代犹他大学的计算机图形学教授。鲜为人知的是,纽厄尔用茶杯和茶托、茶匙和奶精模拟了整个茶具来搭配茶壶。13
图 6.11 展示了如何在计算机中使用几何模型来模拟一个复杂的对象,一个茶壶。同样的想法被用于模拟皮克斯风格中每个角色的形状电影。这是 Newell 茶壶的两种不同表示形式——出于显而易见的原因,它们被称为线框表示形式。左边的模型是三角形的网格。右边的一个是四边多边形的网格。在每个四边多边形上绘制的对角线也会将其转换为三角形网格。三角形是平的,但我们用许多小三角形来表示曲面,以至于在适当的观察距离上,集体表面看起来是弯曲的。很快,我们将描述如何创建这样的网格,但只是假设它们现在存在。
图 6.11
需要明确的是,这些图片不是计算机内部的内容。电脑里没有图片,即使是看起来像几何图形的图片。这些图片是计算机内几何模型的散布像素的渲染,然后呈现在显示器上——即您现在正在阅读的打印页面。
什么是“计算机内部的几何模型”?让我们回想一下,计算机内部只有信息模式。尽管计算不需要位,但如今信息模式总是以这种方式存储。因此,该模型是位于计算机内部某处的集成电路芯片中的高压和低压模式。
我还在前面的章节中指出,位不一定代表数字,但它们经常代表数字,而且在计算机图形的几何模型中也是如此。形成三角形的每条线段(即它的每条边)都由标识其两个端点位置的数字表示。换句话说,计算机内存保存着每个顶点的坐标(边相交的点)、它的水平、垂直和深度位置。因此,计算机内部由三角形组成的模型只是表示数字的位模式,这些数字是三角形顶点在三维空间中的位置。该模型本质上是一个数字列表——通常是一个很长的列表。茶壶列表将使用大约 26,000 个数字——仅用于茶壶。巴斯光年将需要数百万。放大是我们可能处理这些数字的唯一方法。
另一种信息通常存储在几何模型中。你可以把它想象成模型的结构:这个点连接那个点,这个三角形和那个点共享一条边,这个茶壶把手在这里连接到茶壶主体,或者髋骨连接到一个人的大腿骨特点。这些信息也是数字。它们是计算机内存地址。例如,一个点的三个坐标后面可能跟第四个数字。它告诉程序在内存中的哪个位置找到与该点相连的另一个点。
计算机根本不知道这些数据的含义。计算机本身不知道这些高低电压模式是几何模型。需要一个程序来理解这些模式。它是一个“知道”位代表数字并且存储的数字代表三角形的程序。或者数字是可以找到连接组件的地址。一长串无意义的步骤,一个程序,为存储在计算机中的模型赋予意义,该模型将成为计算机显示器上的图片。事实上,是编写程序的人知道程序的含义和它操作的数据。
您不必在创建模型时查看它。在早期,没有人看到他们制作的模型。马丁纽厄尔在电脑中制作茶壶时看不到它的模型。但是现代计算机图形程序确实让我们在设计模型时看到它。我们在构建模型时第一次看到模型的那一刻,在计算机图形学中是一个非常荣幸的时刻,我们很快就会发现。
数字列表如何变成茶壶或巴斯光年?如果您知道一个三角形如何完成从比特到散布像素的旅程,那么剩下的就是计算机的放大荣耀——繁重的工作,无论多么熟练、聪明或精通计算机,人类都无法做到这一点做。计算机做得这么好是愚蠢的。所以,我们的目标归结为让一个三角形出现在屏幕上。如果你明白这一点,你就会明白这一切。
由三角形组成的模型是三维的,但它的图片(即渲染到显示空间的散布像素中的几何模型)只有二维。图 6.11 中描绘的两个线框茶壶看起来是 3D 的,因为它们是透视渲染的,这压扁了三角形。但它们仍然是三角形。这是我们在这里学习如何绘制的那些二维三角形。
在老式的书法展示上很容易。一个程序简单地指示显示器从它的一个端点扫出一条线段——三角形的一侧给对方。然后程序对另外两侧重复该指令。而已。现在可以看到一个三角形的图片。以位形式存储在内存中的简短数字列表现在是显示器上的三角形图片。使用放大的奇迹,我们让我们的计算机非常快速地重复这个简单的过程数万次,以在书法显示器上将完整茶壶的几何模型视为线框图片。
尽管以这种方式显示三角形在概念上很简单,但计算机图形学家花了数年时间来提高这个过程的效率。例如,如果三角形边被另一个三角形共享,则多次绘制它是浪费宝贵的时间。我们已经掩盖了对计算机图形学家很重要的其他几个问题,但它们是管道(参见注释)。您无需了解它们即可直观地理解将作为数值存储在计算机内存位置中的三角形转换为显示屏上的三角形图片最终是多么简单。或者将三角形网格变成茶壶的图片。14
在书法显示器上很容易画出一条线段,也就是一个三角形。但现代显示器不是书法。它们是散布像素的光栅显示。如何在严格按行和列排列的显示器上表示任意角度的直线段?问这个问题的另一种方法是:如何将线段渲染到光栅显示?
计算机图形学中第一个以人名命名的渲染算法是Bresenham 算法。这是已知最早的用像素逼近直线段的程序之一。Jack Bresenham 在 1962 年不得不使用开启或关闭的像素来(粗略地)表示线段。这就是他当时所拥有的一切。15
这是一条线段(图 6.12,对角线),使用 Bresenham 算法渲染为白色背景上的黑色扩展像素。精确点是像素位置。散布像素(大点)放置在最近的位置或给定的线段。Bresenham 的算法是最有效的一种,可用于仅显示黑色或白色的简单光栅显示器。
图 6.12
当然,您在此处看到的对角线段实际上是对其他不可见线段的现代显示器(或打印页面)的扩展像素的渲染。Bresenham 近似线段的“扩展像素”(大点)并不是画得很大的实际像素。像素不是完美的小圆盘,也不是完美的小方块。
Bresenham 的算法和其他类似的算法给了我们早期计算机图形学的“锯齿”。如果你眯着眼睛看图 6.12,你可以看到明显的阶梯(忽略对角线段)。当时许多人认为这是一种丑陋的外观,这是计算机图像必须看起来的样子——再次错误地认为计算机必须是死板的和“机械的”。正如我们在“数字光的黎明”一章中看到的那样,Dick Shoup 花了 10 多年的时间才向我们展示锯齿并不是计算机固有的。1973 年,他展示了用散布像素渲染的精美直线(图 4.26)。但这些像素的值远不止两个——多了两个数量级。
Bresenham 的算法首先吸引我的不是它的效率。布雷森汉姆就是这个名字。它的拼写与来自新墨西哥州克洛维斯的高中同学 Dick Bresenham 的拼写完全一样。当然,该算法的 Jack Bresenham 也不可能来自 Clovis。我查了一下,发现他其实是在英国的IBM工作的,这件事就解决了。或者我是这么想的。但是当一本重要的计算机图形学教科书的第一版出版时,克洛维斯的布雷森汉姆夫人打电话给克洛维斯的史密斯夫人说:“我儿子有一个章节,你的也有。” 她像妈妈们一样夸大了我们的重要性,但重点是:杰克是迪克的兄弟,他确实来自我的家乡。当我终于见到杰克时,我得知他在我认识他之前就离开了克洛维斯。16
现在让我们将这些发展置于历史背景中。我在这里使用了一个流程图,就像我在前两章中使用的那样,来引导我们了解涉及许多参与者的复杂历史。我在“数字光的黎明”一章中介绍的计算机历史流程图涵盖了 1940 年代末和 1950 年代初。我们可以将那个时期视为摩尔定律之前时期的第一阶段——即第一纪元的第一阶段。图 6.13 是该图表(图 4.6)到 1950 年代后期和 1960 年代大部分时间的延续, Epoch 1 的第二阶段。此处重复标有“Whirlwind”的框以显示两个图表的连接位置。
“Moore's Law 1965” 项出现在流程图的中下部,表示启动 Epoch 2 的重大事件。我们将在下一章中保留对 Epoch 2 的探索,除了为了方便起见,此处包含一个经过仔细标记的事件. (发生在 1965 年之后的事件并不意味着它利用了摩尔定律。)个人被包围在圆圈中,而群体被包围在椭圆中。计算机和专用硬件设备位于矩形中。程序、书籍和概念——所有软想法——都是平行四边形。
我在前几章中所说的关于流程图的所有内容也仍然适用于这一章:这不是对该领域的详尽介绍。此处省略的许多球员和事件在文本的其他地方或注释中提供 - 但肯定不是全部。本章的散文可以被认为是图表的冗长标题。和以前一样,图表的复杂性表明,高科技的故事很少,如果有的话,是一个单一领导者的简单叙述。17
根据定义,计算机图形是从计算机内存中保存的不可见几何模型创建可见图片。使用这些模型有两种主要方法,这种区别导致计算机图形的主要划分。
在一种情况下,模型表示旨在存在于现实世界中的对象。计算机辅助设计(CAD) 从业者使用计算机图形来设计对象。归根结底,对象在 CAD 中很重要,而不是图片。CAD是面向对象的计算机图形学。
相反的情况是面向图片的计算机图形学。数字电影是一个很好的例子,说明只有图片才是重要的——而不是所描绘的物体。
一个主要的附带条件是将 CAD 与面向图片的计算机图形学分开。一句话,就是准确。CAD 中对象的计算机模型是旨在存在于现实世界中的对象的准确表示,例如汽车、建筑物和机器零件。早期,CAD 生成的是对象,而不是图片。例如,计算机模型可用于驱动铣床,从金属、泡沫或木块上切割出相应的物体。
由于计算机辅助设计对象必须承受现实世界的磨损,因此它们通常在仍处于计算机模型形式时接受严格的测试。因此,在锻造和组装实际的桁架之前,可能首先在应力的计算机模拟中测试由钢桁架制成的桥梁。桥梁的精确计算机模型用作模拟交通或风对桥梁的预期载荷的输入。或者在计算机中检查打算刚性连接的航天器的两个部分模型形式,以确保它们在金属中实际实现时能够可靠地组合在一起。
图 6.13
但在其他计算机图形学中,图片即输出就是一切——因此是面向图片的计算机图形学。准确的测量和测试是无关紧要的。图片只需要看起来令人信服。皮克斯可能会将伍迪的《玩具总动员》模型发送给某人,后者将其转化为准确的、可构建的 CAD 模型并制作玩具,但原始模型的主要目的是电影《玩具总动员》。
好莱坞以其虚假的战线而闻名。想想牛仔射击游戏中的主要街道。计算机生成的电影都是虚假的前线。伍迪的表面里面什么都没有。他只是肤浅。里面没有什么可测试或压力的。谁在乎他是否可以建造?字符只需要看起来正确。
C.R.T. STORE考虑一下第一光的文本和HELLO MR. MURROW数字光的黎明一章中呈现的早期动画。现实世界中没有任何对象与这些显示相对应。或者回想一下同一章节中的两个早期游戏,跳棋和井字游戏。同样,现实世界中不存在与这些相对应的实际游戏板或棋子。Whirlwind 上显示的数学曲线并不是现实世界中的物体。除了在计算机显示器上散布像素和它们的(简单)不可见模型之外,这些早期示例从未有任何形式。因此,来自数字光黎明的所有图片都是面向图片的计算机图形实例,而不是计算机辅助设计。然而我们会发现,计算机图形学的最早领导者通常来自 CAD。
计算机辅助设计和面向图片的计算机图形学密切相关,并且有着相互交织的历史。他们经常混为一谈也就不足为奇了。在本书中,计算机图形学通常意味着“图片为王”,并缩写为面向图片的计算机图形学。我小心地将“物为王”模式指定为计算机辅助设计。需要重复一遍:虽然 CAD 是计算机图形学的一部分,但我在本书中通常指的计算机图形学是非 CAD 部分。
我限制了前几章中的图表来绘制通向数字光的路径。该图表(图 6.13)仅进一步关注那些导致 Digital Light 的计算机图形部分的内容。它强调了对制作数字电影特别重要的计算机图形部分,这是下一章的重点。幸运的是,它仍然捕捉到了早期计算机图形学的许多重大事件。
计算机图形学出现在特定环境中。它与个人计算机和互联网的发明共享。这是一个国家技术蓬勃发展的故事。
美国政府对纳粹德国的威胁作出反应,向少数几个研发中心投入大量资金,这在资本主义社会中通常是不做的。战争迫在眉睫。速度是必不可少的。这些基金没有市场竞争——没有概述细节的征求建议书文件,没有投标。他们刚刚被分发出去。麻省理工学院是这笔捐款的主要受益者,这份礼物巩固了麻省理工学院作为世界顶尖科技大学的地位。
麻省理工学院于 1940 年获得巨额资助,设立了两个实验室。辐射实验室专注于雷达,这是一项有望扭转战局对抗德国人的技术。对它的研究是最重要的。另一个实验室,伺服机构实验室,专注于复杂系统的控制。(伺服机构或伺服系统通常是使用反馈进行精细控制的电机。)这些实验室多次更名,这使得跟踪变得困难。它或多或少地简化为该表中的两条下降线(缩进标识子组而不是重命名):
|
辐射实验室下降 |
伺服实验室下降 |
|---|---|
|
辐射实验室'40 |
伺服机构实验室'40 |
|
电子研究实验室'46 |
数字计算机实验室'51 |
|
林肯项目'51 |
电子系统实验室'59 |
|
林肯实验室'52 |
CAD项目麻省理工学院'59 |
Whirlwind 计算机始于伺服实验室,于 1951 年进入数字计算机实验室,并于 1951 年被纳入林肯计划(在 Rad Lab 专栏中)。因此计算机图形学主要来自 Rad Lab,但不完全是。计算机辅助设计 (CAD) 项目于 1959 年在麻省理工学院作为电子系统实验室的一部分开始。所以很容易说计算机辅助设计起源于伺服实验室。但正如我们很快看到的那样,麻省理工学院的计算机图形学和计算机辅助设计故事比这更交织在一起。
战后,麻省理工学院教授兼行政人员万尼瓦·布什发表了一篇重要且有影响力的论文:《As We May Think》出现在《大西洋月刊》上,并在《生活》杂志上再版。考虑到他甚至在计算机出现之前,甚至在互联网出现之前,布什就具有惊人的先见之明:
考虑未来的个人使用设备,它是一种机械化的私人文件和图书馆。它需要一个名字,而且,为了随机创造一个名字,“memex”就可以了。memex 是一种设备,个人在其中存储他的所有书籍、记录和通信,并且是机械化的,因此可以以超快的速度和灵活性对其进行查询。这是对他记忆的一种扩大的亲密补充。18
他在这个著名的“memex 备忘录”中犯了很多错误。在上面引用的前一段中,他告诉我们 memex 是桌面大小的。而“memex”这个名字并没有留下来。但他的其他一些评论是对 75 年后未来的准确愿景——也就是说,现在:“全新形式的百科全书将会出现,准备好用贯穿其中的关联线索网。” 并且:“开拓者是一种新的职业,他们乐于通过大量的共同记录建立有用的路径。” 在某种程度上,这就是我对这本书所做的。19
布什(与美国总统没有关系)在建立曼哈顿计划和国家科学基金会方面发挥了重要作用。他是第一位担任总统科学顾问的人(富兰克林·D·罗斯福)。也许他在麻省理工学院最著名的学生是克劳德·香农。但另一个是弗雷德里克·特曼,他后来在斯坦福大学将大学土地出租给高科技公司,以创建现在被称为硅谷的地方。
1945 年在新墨西哥州的三一遗址进行的原子试验——紧随其后的是广岛和长崎爆炸——标志着战争的结束。与俄罗斯的冷战紧随其后。火上浇油的是美国物理学家克劳斯·富克斯(Klaus Fuchs),他出席了三一中心试验并将核机密传递给了苏联。而且,具有讽刺意味的是,在与超级爱国者约翰·冯·诺依曼合作研究美国的氢弹时,富克斯还向苏联人通报了其关键秘密。苏联在 1949 年引爆了他们的第一颗原子弹乔一号,并在 1953 年引爆了他们的第一颗氢弹乔四号。(这些是美国对炸弹的绰号——当然是以约瑟夫·斯大林的名字命名的。)
然后是第二个震惊。1957 年,自满的美国人对苏联发射的太空卫星 Sputnik 感到震惊。尽管正如我们在前一章中看到的那样,采样定理的 Vladimir Kotelnikov 已经清楚地警告过我们这一点。美国的反应是于 1957 年在国防部成立高级研究计划署 (ARPA),并于 1958 年成立美国国家航空航天局 (NASA)。ARPA 将资助大部分成为主流计算机图形学的项目。对计算机图形学的未来有影响力的人将担任 ARPA 和 NASA 的管理员。其中第一个是 JCR “Lick” Licklider。
1960 年,“Lick”Licklider 在IEEE Transactions on Human Factors in Electronics 上发表了一篇论文“人机共生” 。这篇论文与布什 1945 年的备忘录一样重要和有影响力。利克看到我们中间的新野兽,计算机,不是我们的奴隶,而是会与我们共生共存:
未来 10 年或 15 年的时间里,设想一个“思维中心”似乎是合理的,它将结合当今图书馆的功能以及信息存储和检索方面的预期进步以及本文前面提出的共生功能。这幅画很容易扩大到这样的中心网络,通过宽带通信线路相互连接,并通过租用线路服务与个人用户连接。在这样的系统中,计算机的速度将得到平衡,巨大的内存和复杂程序的成本将除以用户数量。20
在摩尔定律和互联网出现之前的那些日子里,利克并没有完全正确。早期的一些领导者认为分时计算机才是王道。不是一个用户一次访问一台大型计算机,而是几个用户显然可以同时访问。这只是“显然同时”,因为计算机的速度足以让它看起来像那样。十个用户每人将在十分之一秒的时间内获得大型计算机的资源。他们将“分时”这台大机器。21
Licklider 和任何其他有远见的人都没有看到摩尔定律会使所有计算机分时共享由单个用户运行的多个应用程序。也就是说,单个用户会感觉到他们所有的应用程序都在同时运行(实际上每台计算机有多个 CPU)。这些有远见的人也看不到计算机会变得如此之小,以至于不再需要共享一台大计算机。世界各地的个人用户也不会相互连接,而不仅仅是计算机中心。但直到 1965 年,摩尔定律才出现。
Doug Engelbart 发表了第三篇论文,与 Bush 的 memex 备忘录和 Licklider 的共生论文一起,构成了我们所讲述的相互交织的故事的知识支柱。增强人类智力:一个概念框架由斯坦福研究所于 1962 年出版。在摩尔定律和第二纪元之前,恩格尔巴特也试图掌握我们人类如何应对我们中间的新恐龙:
这是一个项目的初步总结报告,该项目采用一种新的、系统的方法来提高个人的智力效率。一个详细的概念框架探索了由个人组成的系统的性质,以及将他的基本能力与他的问题相匹配的工具、概念和方法。显示的工具之一最大的直接希望是计算机,它可以用于直接在线帮助,并与新的概念和方法相结合。22
恩格尔巴特相当迂腐地一步一步地探索人类与机器智能交互的方式。然而,比他的文字更重要的是他向我们展示的内容。1968 年,在 ARPA 的资助下,他在旧金山湾区的一次计算机会议上上演了著名的“所有演示之母”,在那里他使用新的指点设备通过图形用户界面与远处的计算机进行了实时交互他发明了——他称之为老鼠。这是我们今天所熟悉的个人计算机界面的开始,使用的是我们今天仍然用来控制它的设备原型,即鼠标。
接下来我们回到起点,专注于这个环境中特别影响计算机图形的部分。
迷幻我的屁股:原子弹的孩子。
——鲍勃·莱诺克斯23
数字光在 1945 年美国原子弹和 1949 年苏联氢弹之间——二战和冷战之间——出现了。回想一下“数码光的黎明”一章,在 1940 年代在少数珍贵的计算机上拍照被认为是轻浮的。他们“应该”计算原子弹或氢弹的统计数据。尽管如此,1947 年,第一张数码照片 First Light 出现在 Manchester's Baby。1951 年和 1952 年在曼彻斯特和剑桥大学创建了两个最早记录的交互式视频游戏。1951 年,由空军资助的第一个有记录的计算机动画出现在麻省理工学院的旋风上。在所有这些早期案例中,几何模型都作为散布像素渲染到显示屏上,其中一些可以交互地更改图片。
冷战催生了 1950 年代最冷血的野兽,或者更确切地说,这些野兽肩负着最冷血的使命——防御核攻击。当时最大、最可怕的是 Sage 计算机,它是旋风的直接继任者。空军与麻省理工学院和 IBM 合作实施 Sage,该项目的规模和成本可与曼哈顿或阿波罗计划相媲美。从 1958 年开始,建造了 20 多个中心,每个中心都有四层楼高,没有窗户,并装有两台 Sage 计算机。每台计算机造价 2.38 亿美元(约合今天的 20 亿美元),占地半英亩占地面积,重达100多吨。每个都有一个通常是黄色的图形显示器,带有一个用于交互的“光枪”。
图 6.14
今天,Sage 剩下的文物包括那些图形站。图 6.14(右)中的军事用户,凝视着野兽张开的大嘴,似乎准备射击它——或者无论如何都要焊接它。为了对这种努力有一个正确的认识,想象一下一个房间里挤满了数十名军人和他们的枪,在排列整齐的展示站。
Sage 的正常业务端(图 6.15)描绘了飞机和导弹在粗糙边界线上的位置。显示右侧的虚线——一个“不明飞行物”——接近美国。但《大西洋月刊》在一篇题为“世界上第一个计算机艺术(这是一个性感的贵妇人)的前所未闻的故事”的文章中讲述了另一个故事。有人,当然是匿名的,使用价值 2.38 亿美元的机器来展示“禁果”——来自Esquire的少女海报,男性杂志。这篇文章声称,她是 1950 年代后期的某个时候,第一次在电脑显示器上描绘了一个人。这甚至可能是真的,但请记住第 4 章提到的可能在 1950 年代初在 Edsac 上的高地舞者的轶事。无论如何,这些图形是已经灭绝的书法或矢量品种,是失败者从长远来看,像素的光栅显示,现代形式。尽管 Sage 恐龙的体型很大,但它的图形很简单——但它们是互动的。24
准备好与否,计算机正在走向人们。这是个好消息,也许是自迷幻药以来最好的消息。. . . 这种趋势的健康归功于一系列奇怪的影响:设计计算机科学的怪胎的年轻热情和坚定的反建制主义;一个惊人的来自国防部最高层的开明研究计划;. . . 以及一种无法抑制的午夜现象,称为太空战。
图 6.15
——斯图尔特·布兰德,滚石,1972 25
1950 年代末和 1960 年代初出现了一种新的反主流文化猫,它是由计算机革命带来的,并且是独一无二的。他们称自己为黑客。在当时,这是一个非常尊重的词,在选举操纵、身份盗用和勒索软件的世界中,它现在所受到的谴责丝毫没有。麻省理工学院的黑客完全爱上了旋风的孙子 TX-0。他们称之为“Tixo”。如果他们愿意自己解决(他们是)并且愿意在一天中最晦涩的时间向它求爱(他们是),那么这就是他们第一台完全属于他们的计算机。Tixo 是一只填满房间的小恐龙,但他们可以与它嬉戏。它有一个图形显示器和一支光笔。26
那些原始的黑客现在是传奇。邪教迅速蔓延到西海岸。斯图尔特布兰德是第一个在地上庆祝他们的人。在 1960 年代后期,他是嬉皮一代的产品圣经《全球目录》的著名出版商。他的下一个噱头是 1972 年在滚石杂志上发表的一篇文章,该文章将公众的注意力放在了黑客身上,并在一个名为施乐帕洛阿尔托研究中心 (PARC) 的地方引起了一些关注。它的标题定下了基调:“太空战争:计算机流浪者中的狂热生活和象征性死亡”。27
那时,至少有一名 MIT 原始黑客已经搬到 PARC,靠近嬉皮士的首都旧金山。纽约州北部施乐公司的三件套纽扣西装高管对他们研究中心的摇滚报道感到尴尬。电脑坏了!那些看起来和行为都像这样的人——比如我,当时我在那里——不可能有严肃的商业想法。这种无法跨越的文化鸿沟可能是施乐未能利用个人电脑的原因。正如我们现在所知,它是在 1970 年代初在 PARC 发明的——鼠标、基于 Windows 的界面、激光打印机、网络等等。通过那些流浪汉。28
1984 年,记者 Steven Levy 发表了《黑客》,巩固了他们的名声。他的书讲述了这帮才华横溢、有影响力的恶作剧制造者的完整而奇妙的故事。我在本书中提到它们是因为他们在 MIT 的另一个特遣队在 TX-0 的儿子 TX-2(没有 TX-1)上做了一些非凡的事情之前就在计算机上制作了照片。29
在“数字光的黎明”一章中,我们了解到数字音频专家 Tom Stockham 教犹他大学的一代计算机图形师如何对他们的采样图片进行抗锯齿——如何消除“锯齿”。斯托克汉姆在麻省理工学院担任教授时受到了他在 TX-0 上制作音乐的黑客的启发。30
但最令人难忘的黑客成就是一款名为Spacewar的二维互动游戏。他们使用 Tixo 的 CRT 图形显示器在 Tixo 上创建了几个“图形黑客”。但是大楼里最新的计算机很快就成为了黑客的宠儿:PDP-1。他们于 1962 年在其上创建了Spacewar。图 6.16 显示了一个打开动作。PDP-1 是一台价值 120,000 美元的计算机(今天略低于 100 万美元),它由数字设备公司提供给麻省理工学院,以试图打破巨头 IBM 在市场上的锁定。它本质上是 Tixo 的儿子,并且在各方面都更好。31
为了我们的目的,我们只需要知道Spacewar是交互式计算机图形。用户通过操纵杆和按钮与游戏互动。它有一个缓慢旋转的星域、两艘从鼻锥发射鱼雷(点)的卡通火箭飞船和一颗中央恒星。有重力和跳到超空间按钮。太空战争是游戏历史和实时计算机图形学中的重要事件。但在本书中,我们关注的是不受时间限制的计算机图形的数字光部分。
“实时”一词有多种含义,都与人类对时间流逝的感知有关。一种流行的含义是实时计时,就像在电子游戏中一样。其他是实时按需的,就像在计算机模型的“交互式”设计中一样。这些方便的术语可以帮助我们细分数字光的广阔范围。
图 6.16
在电子游戏中,一个假想的时钟滴答作响,并且必须渲染一张新图片并准备好在每次滴答时显示。视频的自然“时钟”是每秒 30 帧的帧速率,之所以选择这个速率,是因为它近似于人类对时间流逝的感觉,并且与现实世界中的时间同步。因此,在电子游戏中,每三十秒必须显示一张新图片。
电子游戏是现代世界时钟品种实时图形的压倒性例子。但在早期,飞行模拟器——每台花费数百万美元——是主要表现形式。战斗机飞行员将在飞行模拟器上进行训练,而宇航员将在航天器模拟器上进行训练。他们今天仍然这样做。虚拟现实 (VR) 是时钟实时类的最新成员,可在特殊护目镜内渲染到双显示器,以获得立体或所谓的 3D 效果。
非时钟或按需实时图形的一个主要示例是内部计算机模型的交互式设计。这只是另一种说法,“图片变化得足够快,足以让用户相信它在与计算机交互时‘即时’发生。”
另一个例子是几乎每个应用程序的每个界面。我只是单击了 Word 中的保存图标。当我将鼠标光标悬停在它上面时,图标“立即”亮起,然后当我单击鼠标并保存文件时,“时间正在消逝”的旋转图标“立即”出现。
在时钟或非时钟情况下,实时的权衡要么是低图像质量,要么是高产品价格。在时钟的情况下,电子游戏仍然(截至 2020 年)显示在保持低消费价格的同时,没有足够的时间来计算完全渲染的图片的视觉伪影。
在非时钟情况下,模型交互设计中使用的图片质量通常仍低于如此设计的对象或场景的最终渲染。设计师可能会观看他们正在创建的对象或角色的线描显示 - 例如茶壶的金属丝网视图,而不是完全着色、彩色和纹理的茶壶。
计算机图形学是我的职业,但我对它的历史只有一个摇摇欲坠的把握。我收到的版本大致是这样的:Ivan Sutherland 于 1962 年在麻省理工学院编写了第一个交互式计算机图形程序 Sketchpad。然后他于 1968 年进入盐湖城的犹他大学,开创了计算机图形学的王朝先驱者。事实上,这个总结有很多道理。例如,Ed Catmull 是 Sutherland 的学生之一,多年来我们在纽约理工学院、卢卡斯影业和皮克斯的许多同事都在犹他州接受过教育。我们使用的早期图形硬件是由 Evans & Sutherland 制造的,这家公司也是 David Evans 和 Ivan Sutherland 于 1968 年在盐湖城共同创立的。
但萨瑟兰的叙述与我们在“数码光之黎明”一章中所发现的不符:第一张数码图片、互动游戏和动画是在 1940 年代末和 1950 年代初出现在最早的计算机上的。Whirlwind 有一个光枪,可以让你与它的显示器互动。正如我们在本章中看到的那样,在 1950 年代后期,正在射击或焊接 Sage 的人正在与它的图形进行交互。Spacewar在 Sketchpad 之前就在麻省理工学院进行了互动。显然,故事中存在差异需要解释。
像许多技术史一样,收到的版本省略了很多内容,并且过分强调了一个人。它忽略了该领域的两位著名创始人史蒂文·库恩斯(Steven Coons)和皮埃尔·贝塞尔(Pierre Bézier),他们比萨瑟兰早了一代人。然而,该领域非常了解这些创始人。几十年来,计算机图形学的最高奖项一直是 Coons 奖。几十年来,流行的应用程序 Adobe Illustrator 和 Adobe Photoshop 也采用了贝塞尔曲线。但是历史网络并没有顺利编织在一起。
简单的叙述实际上也不符合我个人所知的历史。我遇到并与之共事的第一个计算机图形学先驱是赫伯特·弗里曼,他不是犹他州的学校。他出生于德国的赫伯特弗里德曼并设法逃脱在阿尔伯特爱因斯坦的帮助下,纳粹的祸害。当赫伯的父母试图获得进入美国的许可时,只有他一个人被拒绝,被指控患有肺结核。这不是真的,但是爱因斯坦本人花了数年时间和三封信才让孩子及时克服官僚障碍并于 1938 年安全进入美国。1949 年,赫伯与爱因斯坦会面,并亲自感谢了爱因斯坦的巨大恩惠。32
在遇到这位伟大的科学家前大约一年,赫布从哥伦比亚大学获得了电气工程硕士学位。1952 年,在麻省理工学院的一个暑期班上,他遇到了旋风,并对数字计算机产生了兴趣——以至于到了第二年,他在斯佩里公司设计了自己的计算机,称为 Speedac。1958 年,哥伦比亚大学的博士学位导致在麻省理工学院的伺服机构实验室和次年的林肯实验室工作。1960年他加入纽约大学。他的专长是计算机图形学,1972 年,他与人共同创办了最早的 Digital Light 学术期刊之一,这反映在其标题:Computer Graphics and Image Processing中。制作和服用。几何和像素。33
Herb 于 1969 年直接从斯坦福研究生院聘请我进入他在纽约大学的系。在我与他相处的四年里,他向我介绍了来自加拿大的 Ron Baecker 和 Marceli Wein,两位最早的计算机动画师,以及来自英国的 Robin Forrest。
罗宾,我最喜欢的苏格兰人,在我研究和写这本书的时候,从诺里奇来到伦敦,引导我了解我所在领域的早期历史。当我们整天在布卢姆斯伯里酒店的茶室里欢笑和回忆时,他开始这样做。34
“我第一次见到你是在 1971 年 11 月,”我们握手时他开口道。
“而你是在 1990 年代把我卷入那些专利案件的魔鬼,”我取笑道。
“我确实是。”
(计算机图形学同事和我曾在英国法庭上尽最大努力从英国硬件公司手中拯救一家英国软件公司。我们未能提出诉讼,软件公司被迫停业。但随后同一家硬件公司尝试了在美国法院对一家美国公司采取同样的法律手段。这次我们成功地帮助保护了 Adobe 及其旗舰 Photoshop 产品免受高额版税的侵害。法院仁慈地裁定所有五项专利均无效,并消除了该领域的祸害。)
“而我,”罗宾补充道,“首先把你介绍给了杰克·布雷森汉姆。”
Jack Bresenham 是来自新墨西哥州克洛维斯的另一位计算机图形师。罗宾和我开始跑步。35
对于早期的历史,我再也找不到比这更好的指南了——当然不是更机智的了。Robin 在东英吉利大学工作了 40 多年,现在是名誉教授。罗宾自己经历了大部分早期历史。他曾多次与 Coons、Bézier 和 Sutherland 合作,并曾在早期的 MIT、剑桥和犹他大学中心工作。但他也告诉我一些鲜为人知的地方,比如雪铁龙、雷诺和通用汽车。36
罗宾的故事很快阐明了基本的历史和定义问题。计算机图形学是关于物体的内部模型和它们的图片。计算机图形学的历史是从物体模型还是从它们的图片开始的?根据重点不同,历史有不同的版本。计算机图形学和计算机辅助设计的历史通常并且可以理解地纠缠在一起。
将 Coons 和 Bézier 称为计算机图形学的奠基人的问题在于,他们都没有制作图片,至少一开始也没有。Coons 在旧的 Chance Vought 公司创建了他在飞机行业的基础工作。贝塞尔在法国汽车制造商雷诺完成了他的工作。他们都在计算机内部使用了三维表面的几何模型,但都没有显示设备来查看图片。Coons 创造了实际的机身表面和 Bézier 实际的汽车车身表面。
他们并不关心图片本身。他们关心由真实材料制成的真实 3D 空间中的真实物体——汽车和飞机机身,或它们的模型。这又是创意空间与展示空间的区别。Coons 和 Bézier 有创意空间,但没有展示空间。或者换句话说,他们的展示是物体本身,而不是它们的照片。他们拥有计算机控制的机器,可以从真实材料中雕刻或切割实际物体。换句话说,他们是针对对象进行计算机辅助设计,而不是针对图片进行计算机图形设计。我们将在本章后面花时间解开这些领域。但毫无疑问,Coons 和 Bézier 都是两者的主张。他们是一个很好的起点。
Coons 让我兴奋,他让 Ivan Sutherland 兴奋。. . 他当得起几个正教授。
——Timothy Johnson,麻省理工学院 Sketchpad III 37的创造者
图 6.17
Steven Coons 的照片,由他的麻省理工学院学生 Abbott Weiss 拍摄,1964 年。
Steven Anson Coons(图 6.17)不仅是一位知识领袖。他是一位有趣的讲师——他的学生们都很喜欢他。他很有趣。38
故事是这样的,大约在 1936 年,当 Coons 在麻省理工学院学习数学时或之后,他在 Chance Vought Aircraft 找到了一份“推扫帚”的工作。当他扫地时,他碰巧注意到一位老板陷入了飞机表面表示的数学问题。所以他秘密地想出了一个解决方案,这个解决方案被称为Coons 补丁,这个名字一直流传至今。从作为一名直观的数学家将飞机设计形式化的卑微开始,他成为计算机辅助设计和计算机图形学之父。39
库恩斯的职业生涯有过坎坷。年轻时,他“在不利条件下”仅仅一年后就不得不离开麻省理工学院的数学学习,并且从未获得正式学位。不利的条件可能是简单的贫困。尽管如此,由于他在飞机工业方面的成就,他于 1948 年被麻省理工学院聘为助理教授。最终,他晋升为副教授。但令他的同事们困惑的是,尽管他对麻省理工学院的其他先驱产生了深远的影响——尤其是对伊万·萨瑟兰和蒂姆·约翰逊(见流程图)——但他却没有得到进一步的提升。也许他没有博士学位是原因。尽管如此,他随后在雪城大学、犹他大学、密歇根大学和科罗拉多大学任职。40
Robin Forrest 的职业生涯跨越了计算机辅助设计和计算机图形学。那天在布卢姆斯伯里,他给我讲了一个计算机辅助设计的成功故事,那是在计算机出现之前的时代。它涉及著名的喷火战斗机,它在 1940 年英国与德国空军德国空军的关键战役中发挥了如此突出的作用。喷火战斗机的主要设计是将一组横截面刻在铝板上,并存放在英格兰汉普郡某处的大桌子上。尽管可以从主人那里复制图纸,但它肯定没有安全地保存在计算机内存中,因为当时还不存在。德国空军在汉普郡的一次空袭将摧毁这架重要战斗机的规格。41
但罗宾的问题是:这些横截面之间的喷火战斗机翼形状是什么?嗯,它没有被定义,这是一个问题。需要一个插入连续横截面的光滑表面,但它还不存在。
这些话让我们想起了 Ravi Shankar 故事中的样条曲线。飞机设计师需要将样条曲线推广到表面。他们需要一个在连续曲线之间插值的光滑表面——比如喷火式的横截面。该解决方案称为补丁,即在两条曲线(例如两条样条曲线)之间平滑通过的一块曲面。两条曲线形成一个面片的相对边缘,其间的曲面从一个边缘的曲线到另一边的曲线连续变化,甚至是优雅的变化。Spitfire 工程师需要在这些金属板上刻痕的横截面之间有一个明确的补丁,以完全定义飞机的机翼。但这个概念在 1940 年还不存在。
将补丁引入飞机设计的人是史蒂文·库恩斯。补丁是他的话。他没有在喷火战斗机上工作,但他确实在航空业工作,并试图解决这个迫在眉睫的问题。他定义的 Coons 补丁是上面描述的补丁,但有两对对边。所示的 Coons 补丁示例在图 6.18 中,它类似于一张皱巴巴但没有褶皱的薄纸。每条边沿两个不同的方向平滑弯曲。平滑起伏的曲面在两个方向上连接或插入相反的边缘曲线。
图 6.18
在 Coons 的定义中,补丁可以有任何形状的边缘,而不仅仅是图中所示的简单曲线。例如,一条边上的曲线可能是您手写的名字,而另一边可能是您的姓氏。只要您提供一种将一个名称混合到其相反名称的方法,它仍然是一个 Coons 补丁。但这种混合功能可能是一件棘手的事情。42
为了在计算机图形中制作复杂的表面,例如茶壶、角色或飞机,我们设计了一组贴片,这些贴片沿着边缘平滑地相互连接,并覆盖所需的表面——比如被子——包括它的角落和缝隙。然后我们通过沿每条边递增的方式将每个补丁细分为四边的“补丁小”,如上图所示。像这样进行细分,直到小片变得足够小,可以被视为平面多边形。就我们的目的而言,这些扁平小片中的每一个都像以前一样被分成两个带有对角线的三角形。所以,我们又回到了只需要理解一个三角形的问题上。
显示三角形很容易,使用 Amplification 显示由数千个三角形组成的模型也很容易。但是没有办法将建造的难度降到最低首先是一个模型。建模是雕刻的一种形式,没有简单的方法来教授雕刻。这是专业建模师的任务。
计算机图形学中最负盛名的奖项旨在表彰 Coons 补丁的发明者。Steven Anson Coons 奖由最大和最重要的年度计算机图形会议 Siggraph 颁发。它的名字是计算机图形和交互技术特别兴趣组的缩写,它是大型专业计算机科学组织的一部分,古朴地称为计算机协会 (ACM)。几十年来,Siggraph 每年都是成千上万的爱好者不容错过的会议。
我们将这个奖项和这次会议都归功于另一位从纳粹手中拯救出来的早期计算机图形先驱 Bertram Herzog (1929-2008)。赫尔佐格被犹太儿童的 Kindertransport 计划救出。它把他安全地送到了英格兰的寄养家庭。1946 年,他从那里移居美国,并于 1961 年在密歇根大学获得博士学位。几年后,他遇到了库恩斯,库恩斯成为了他的朋友,并将他转化为计算机图形学。Bert 在 1969 年创立 Siggraph 方面发挥了重要作用。他帮助他的朋友将 Siggraph 的最高奖项命名为 Coons 奖。43
他被描述为具有放荡精神的快活,一个理性的不墨守成规者。在他的环境中,他简直就是“天才”。
——关于皮埃尔·贝塞尔
从那以后,我不可避免地被视为一个危险的疯子,被允许逍遥法外太久。
——皮埃尔·贝塞尔,关于他自己44
皮埃尔·艾蒂安·贝塞尔(Pierre Étienne Bézier),据说是一个非常机智的人,是弗兰克人的图形计算机图形学和计算机辅助设计之父,但只有一半的 CAD 实践者。像 Coons 一样,Bézier 在有图片之前就已经对表面进行了数学计算。他为汽车车身设计提出了类似的补丁创意。图 6.19 中的他的肖像是用贝塞尔曲线绘制的,以他的名字命名。45
贝塞尔是一个彻头彻尾的汽车人。作为一名工程师,他在 23 岁时进入雷诺并在那里度过了他的整个职业生涯。和 Coons 一样,他从 1933 年开始做工具设置员,然后在 1934 年晋升为工具设计师。这导致了他于 1945 年成为工具设计办公室的负责人。到 1948 年,他担任生产工程部主任,然后于 1957 年担任机床部主任。
图 6.19
贝塞尔与贝塞尔。© 安东尼·黑尔,2010。
这一切听起来像是一个顺利展开的职业生涯,但我遇到了一个令人费解的空白。雷诺在线历史记录称,“雷诺工程师皮埃尔·贝塞尔在德国战俘期间改进了通用汽车在战前引入的自动机器原理。” 直到这本书的截止日期前不久,我才知道更多关于这个神秘时期的信息。在法国 Facebook 页面的最后一分钟发帖后,一位联系人解开了这个谜团:Bézier 被囚禁在德国 Offiziersläger(军官战俘营),可能是 Osterode am Harz 的 Oflag XI-A,大约一年从 1940 年开始。46
Bézier 负责为著名的 4CV 汽车生产大部分机械零件,这是第一辆销量超过 100 万辆的欧洲汽车(图 6.20,左)。但这发生在计算机辅助设计出现之前。1960年开始从事CAD研究,主要研究方向为交互式曲线曲面设计、粘土模型和大师的三维铣削。到 1968 年,他完善了名为 Unisurf 的系统,并在雷诺投入生产。中间照片中的雷诺 10 可能使用了这个 CAD 系统。他确实有绘图机,但他的明确目标是制造汽车。它们是他的终极展示。雷诺“大师”最右边的照片就是一个例子。47
图 6.20
1969 年,Robin Forrest 拜访了 Bézier。“他有一个可以切割全尺寸汽车面板的系统,我们对此印象非常深刻。” Forrest 讲述了 Bézier 如何让他的工程师接受计算机辅助设计:
贝塞尔是雷诺生产工程副总裁,可以对他的员工说:“你可以停止使用粘土模型,现在你将使用我的方法。” 但他告诉我们他没有这样做。. . . 贝塞尔制造了这台机器,你可以用它来制造汽车面板,但他只是离开了它。他有一两个明星设计师感兴趣,但想知道这是什么东西。他告诉他们如何使用它。他们中的一些人被说服并玩弄它。他说:“有一天早上,我进来了,这个美丽的木雕就在我的门外[cf. 图 6.21],那是当我意识到我已经赢得了战斗。因为这可以做艺术。” 这就是引入这些技术的方式。你不强迫它。你让人们自己找到它并做出令人惊奇的事情,然后他们做事,你会想,“他们到底是怎么用我的系统做到这一点的?我不知道!” 这就是这种工作的好处。48
贝塞尔在晚年变得严肃学术。1975 年退休几年后,他在巴黎大学获得了数学博士学位。他于 1999 年去世,刚刚错过了新千年,比 Coons 活了 20 年。
Siggraph——一年一度的计算机图形学会议——在 1985 年授予他第二个 Coons 奖,第一个奖是在 1983 年授予 Coons 的一位直接知识继承人 Ivan Sutherland。面向图片的计算机图形学没有贝塞尔奖,但有一个计算机辅助设计贝塞尔奖(由实体建模协会授予)。
图 6.21
蒂娜·梅兰登摄。
因此,我的脑海中开始萌生想用数学方法研究车身形状的想法。. . 这要么是绝对的轻率,以免称其为疯狂,要么是一种惊人的把戏。. . . 法语单词carrosserie中有rosserie,代表车体(rosserie意为nastiness),真是太真实了!
——Paul de Casteljau,关于他自己49
Paul de Faget de Casteljau 是该领域的另一位法兰克人之父(图 6.22)。和贝塞尔一样,他也从事汽车行业,也有一种自嘲的幽默感。1958 年,他在 Citroën 开发了用于汽车设计的数学系统。类似于贝塞尔稍后在雷诺的工作。与贝塞尔不同,他经常被忽视,尽管贝塞尔本人优先考虑他。不幸的是,对于 de Casteljau,Citroën 直到 1974 年才允许他公开他的发现。到那时,两人都起源的曲线被称为贝塞尔曲线,因此它们仍然存在——斯蒂格勒定律再次发挥作用。具有讽刺意味的是,de Casteljau 是 2012 年计算机辅助设计领域的贝塞尔奖得主。50
图 6.22
Bézier 和 de Casteljau 都将计算机视为提高汽车制造效率的一种方式。他们似乎独立地开发了另一种表示表面的数学方法,即贝塞尔补丁。这些不是 Coons 贴片,但与它们相似,因为它们也可以平滑地连接在边缘——可以说是绗缝——形成复杂的表面。Bézier 补丁是另一种建模表面的方法,然后可以将其细分为多边形和三角形,以便随后渲染到显示器。
图 6.23
Bézier(或 de Casteljau)的数学在这里并不重要,但对它的直觉很重要。回想一下 Ravi Shankar 的演示,以及平板点的水平和垂直坐标是如何使用具有两个负“叶”的扩展器展开的,以便通过平板点获得样条曲线。它被称为 Catmull-Rom 吊具(图 6.7,底部)。如果我们使用图 6.23 中的扩展器,没有负波瓣,那么我们会得到一个稍微平滑的样条曲线。计算机图形学家将其称为B 样条曲线(对于如此漂亮的曲线而言相当笨拙),其中 B 代表“基础”,但在其他方面没有任何信息。图 6.23 是 B 样条扩展器。
两条样条曲线在图 6.24 中并排显示。两者都源自完全相同的点,即来自 Ravi Shankar 演示中的平板电脑的点。尽管您可能需要费力才能看到它,但新曲线(右侧)比旧曲线更优美。它通过仅在数位板点附近而不是通过它们来实现这一点。因此,它是近似样条,而不是插值样条。
Bézier(或 de Casteljau)给了我们一条两者兼而有之的曲线,尽管他(他们)不这么认为。下一张图片(图 6.25)显示了两条贝塞尔曲线——一条连接最左边的点和中间的一条,另一条连接中间的点和最右边的一条。Adobe Illustrator 和 Photoshop 有一个特殊的工具(钢笔工具),用于从像这样的贝塞尔线段创建平滑曲线。设计师从最左边的点开始画一条线,这里用虚线表示,在该点给出所需曲线的倾斜度。我们称之为切线。设计师通过旋转(虚线)切线来控制倾斜的角度,使用给定的点作为枢轴。它们通过延长或缩短切线来控制曲线的松紧度——通过将曲线外点移入或移出。
图 6.25 中的左侧曲线是通过旋转和缩放两条切线的长度创建的,一条用于最左边的点,一条用于中间点。右侧曲线同样是通过旋转和缩放显示的另外两条切线创建的。
在所有情况下,虚切线的斜度都与曲线通过给定点时的斜度相匹配。贝塞尔曲线通常按如下方式连接在一起以获得完全优雅:第二条曲线的第一个点的切线只是一个第一条曲线的最后一点的切线的延伸。它的长度完全相同,并以相同的角度倾斜,但方向相反。
图 6.24
图 6.25
图 6.26
通过戴夫科尔曼。
Bézier 会将此过程描述为使用四条切线进行控制,对最左边、中间和最右边的点进行插值。但在数学上这相当于指定图中的七个点。四个偏离曲线点定义了四个切线的长度和角度。平滑连接两条贝塞尔曲线形成的曲线通常只描述为一系列贝塞尔曲线。但它可以被称为贝塞尔样条,我建议它应该是。然后我们可以说,图中的贝塞尔样条曲线插入了七个点中的三个,并逼近了另外四个——两者都有一点。
您现在正在阅读的文字字母很有可能是用贝塞尔曲线设计的。图 6.26 显示了曲线的一个有趣使用,“贝塞尔曲线”是用贝塞尔曲线设计的。短直线显示曲线连接处的倾斜(所有水平或垂直,顺便说一下)。
贝塞尔面片是一个面片,其每条边由贝塞尔曲线(或德卡斯泰尔约)定义。它是另一个用于复杂曲面建模的工具。在图 6.27 中,Martin Newell 的茶杯和茶托——不像他的茶壶那么有名——是用 26 个 Bézier 补丁建模的。从左到右,补丁被细分为越来越小的“补丁”,以显示在计算机图形学中如何处理曲率的外观。不在茶杯或碟子表面上的点网是近似的点通过补丁。与内插的 Coons 补丁不同,Bézier 补丁(部分)近似。
图 6.27
通过米歇尔·博西。
罗宾·福雷斯特翻译了贝塞尔的一本书,并从他那里收到了一份法文版,题为:“对于罗宾·福雷斯特,我欠他的可能比他想象的要多。” 罗宾说:“我还没有解开这个谜团。” 这可能与罗宾向贝塞尔和世界展示了贝塞尔最初使用的数学实际上与谢尔盖·纳塔诺维奇·伯恩斯坦(Sergei Natanovich Bernstein)引入的复杂数学有关——另一位伟大的俄罗斯人。伯恩斯坦是多个领域的专家,但这里相关的是近似理论。他之于近似理论就像埃德蒙·惠特克爵士之于插值理论一样。51
黎明一章的一个教训是,数码光始于 1947 年,并在 1950 年代初期蓬勃发展——包括计算机图形学,数码光的一个分支,它将内部几何模型渲染成可见的图片。计算机图形学的早期十年,就像 Coons 和 Bézier 早期的 CAD 工作一样,几乎从未被提及。相反,该领域的通常历史始于 Sketchpad。我们的部分工作是阐明是什么让 Sketchpad 如此重要。
Ivan Edward Sutherland 于 1962 年在麻省理工学院展示了著名的 Sketchpad,并完成了它并于 1963 年 1 月作为他的博士论文发表。这是一个以用户交互为特色的二维几何设计程序。它当时受到高度吹捧,现在仍然是——而且应该是。但计算机图形学的荣耀是在二维透视图中查看三维场景和物体。52
是 Sutherland 的研究生 Timothy Edward “Tim” Johnson 将 Sketchpad 放入了三个维度和透视图。他将他的程序命名为 Sketchpad III,并于 1963 年 5 月发表了他的硕士论文。“III”是三个尺寸,而不是第三版。(没有 Sketchpad II。)为什么 Sketchpad III 没有以同等的力量被记住?可以说,从二维转换为三维并没有那么大的变化,实际上是一个相当明显的变化。但观点是巨大的、不平凡的、不明显的。Sketchpad III 采用了 Johnson 从另一位研究生 Lawrence Gilman “Larry” Roberts 那里学到的透视解决方案。罗伯茨于 1963 年 6 月完成了他的博士论文。因此,1963 年是计算机图形学三巨头的一年,所有这些都在麻省理工学院的林肯实验室:伊万·萨瑟兰、蒂姆·约翰逊和拉里·罗伯茨。两个,萨瑟兰和约翰逊,是史蒂文库恩斯的学生。
图 6.28 显示了代表三个各自成就的图标,Sutherland 画板的正方形,Johnson 画板 III 的立方体,以及 Roberts 对 Sketchpad III 贡献的透视立方体。
图 6.29 以相同的顺序显示了 MIT 同学三巨头的照片:萨瑟兰、约翰逊、罗伯茨。53
图 6.28
图 6.29
Triumvirate 在 TX-2 上完成了他们的工作,Tixo 的儿子和旋风的曾孙。1940 年代末和 1950 年代早期的计算机大多采用光栅显示器。然后书法显示器开始使用了几十年,并分散了计算机图形师的注意力——我在第 4 章中提到的书法绕道。千禧年的大数字融合重新引入了光栅显示,它现在已成为世界标准。
TX-2 显示器是一种跨界显示器。它是书法的,但只能以固定的阵列显示点。Ivan Sutherland 1963 年的 Sketchpad 论文将其描述为 1024 x 1024 的点阵列,这暗示了光栅显示。但是这些点可以按随机顺序打开,而不是逐行顺序。如果不刷新,这些点就会关闭,这只是由于阴极射线管屏幕上荧光粉的自然衰减。
在数码光的黎明章节中,有两种书法展示的图片。最明显的“书法”,如手写,是在运动方向上画出光线的笔迹。另一种类型是沿着这样的路径放置点,而不是连续的笔画。图 6.30(左,从黎明章节重复)是书法的。它是点状的,但这些点并不限于确切的网格位置。
图 6.30
图 6.30(右)看起来像一个光栅显示——但有一个很大的不同:这些点是以书法顺序显示的,而不是光栅顺序。所以这个显示不同于前面的任何一个。它的斑点不是散布像素。它们是书法笔画的固定网格上的近似值。TX-2 显示器就是这种书法风格。以下是 TX-2 中实际发生的情况:按顺序绘制了一系列线段。每一个都通过类似 Bresenham 的渲染算法转换为光点位置,并且这些位置的光点由显示电路顺序打开。
有时一定很不愉快,因为萨瑟兰煞费苦心地描述防止屏幕闪烁的方法。可以绘制一些不闪烁的线段,但随着线段数量的增加,显示将无法跟上并开始闪烁。他介绍了只显示每八分之一的技巧,然后稍后再返回以类似间隔的方式显示它们之间的其他七个,但这导致线条“由爬行的点组成”。这是一种交错显示的形式,但用于书法而不是光栅显示。他还介绍了点的随机显示,使屏幕“闪烁”而不是爬行。54
毫不奇怪,当 Sutherland 后来与 David Evans 共同创立了 Evans & Sutherland 公司时,它的第一批产品之一是真正的书法展示——笔画而不是斑点,而且绝对不是限制在网格中的斑点。它被称为 LDS-1,代表画线系统,而不是某些人认为的后期圣徒,因为联合创始人埃文斯是虔诚的摩门教徒,而 E&S 位于盐湖城。LDS-1 于 1969 年首次出货。该公司的下一个版本是流行的图片系统。纽约理工学院的计算机图形实验室(包含后来成为皮克斯的小组)于 1974 年开始使用 E&S 的机器,第一个是书法图片系统。55
以下是如何看待当今的计算机图形,无论它在哪里使用——电影、游戏、VR 等等:一个虚构的世界是在计算机内存中建模的。这是模型,不是图片。它是标准的三维几何 á la Euclid 和其他早期希腊人。它不可见。这个世界的图像是二维的。所以为了拍一张照片,一个虚构的相机被放置在虚构的世界中。摄像头是虚拟的。它的机身、镜头、三脚架等没有建模。我们只关心虚拟摄像机在场景中的位置、指向的方向以及向上的方向。就像一个真正的相机一样,这个虚拟相机有一个取景器,可以捕捉到它所看到的虚构世界的矩形视图。我们称取景器为透视视口 在计算机图形学中——只是viewport,简称。Tim Johnson 首先在 Sketchpad III 中实现了(透视)视口。56
虚拟相机在其视口中捕获的虚幻世界部分被展平为二维 - 就像真实相机在其取景器中将现实世界展平为二维图像一样。还有一件非常重要的事情:视口以透视的方式看到了虚幻的世界——就像真实相机的取景器一样。这与我们人类感知视觉世界的视角相同。Johnson 在 Sketchpad III 的视口中使用了 Larry Roberts 的透视解决方案。
我称其为计算机图形学的中心法则,因为它不必如此。毕竟,计算机是人类发明的最具延展性的工具。几何不一定是欧几里得,但它在中心法则中。它可能是科捷利尼科夫的祖父所鼓吹的洛巴乔夫斯基式——没有平行线(见第 2 章)。最重要的是,视角不一定是文艺复兴时期的视角,但中央教条就是这样。简而言之,中心法则代表了一个不真实的世界,就像我们人类感知的真实世界一样。这是虚拟相机对虚幻世界的透视图,全部在计算机内部,最终被渲染成像素,以便我们可以实际看到它。
MC Escher 的艺术展示了扭曲的视角会变得多么糟糕。在图 6.31 中,受 Escher 的启发,在没有计算机的情况下完成,直梁显然必须弯曲,以使它们的网格在透视中消失,朝向无限远的两点。这两个消失点在三维空间中彼此垂直的线上,但它们在一个平面中沿着一条线出现。这在透视图中并不罕见。但是这幅画的目的是让从下消失点发出的扩散线在看向上消失点时变得明显不断地间隔开。需求如此之大,以至于从较低的消失点朝向观察者的直线必须向上弯曲以适应它。而那些来自上消失点的人必须向下弯曲。这是非人的观点。我们看不到直线弯曲,中央教条也不允许。(这张图片,来自中心教条之外,被使用了 38 年作为年会的封面计算机科学程序的基础。)
计算机辅助设计中计算机图形学的早期起源,例如,在 Coons、Bézier 和 de Casteljau 的工作中,促成了中心教条。在 CAD 中,设计的对象必须存在于现实世界中,这是必不可少的。但是,尽管中心法则是几乎总是在计算机图形学中实践的学科,但它肯定不是必需的。计算机艺术家从一开始就违反了它。从某种意义上说,这就是他们作为艺术家的角色——在没有人为限制的情况下运用数字光的媒介,并向我们其他人展示他们的发现。但是有即使在中心教条学科中也有很多创造力。拍摄皮克斯、梦工厂、蓝天和其他制作动画故事片的电影。学科内有如此多的创意空间,以至于许多艺术家从不考虑在它之外冒险。
图 6.31
突触,© Alvy Ray Smith,1973。
这是妙语。1963 年,麻省理工学院的约翰逊和罗伯茨向我们介绍了现在使用的中心法则(尽管他们没有这么称呼它)。他们应该得到比他们往往得到的更多的荣誉。特别是,他们获得的信用比萨瑟兰少。但在某种程度上,这三个人都参与其中。这就是为什么我称他们为三巨头。在扩展这三位领导者之前,让我们简要回顾一下计算机图形学中透视的历史,因为约翰逊和罗伯茨并不是第一个使用透视的人。他们也不是首先使用中央教条。
动画对于计算机图形学来说是很自然的,因此可以大大扩展。. . . “艺术机器”的能力——计算机图形学是官方命名法——可以最好地描述为从任何所需的观察位置与空间中任意数量的点相关联。
——威廉·费特,“艺术机器”,1962 年 2 月57
在 1963 年有影响力的 Triumvirate 贡献之前一年多,堪萨斯州威奇托波音飞机公司的威廉·费特 (William Fetter, 1928-2002) 申请了在计算机上执行透视的专利。他于 1961 年 11 月向研究数学的同事沃尔特·伯恩哈特提出申请。该专利包含一架飞机的图纸,图 6.32,这可能是有史以来第一个以透视渲染的计算机模型。58
从上面的题词可以明显看出,Fetter 在 1962 年 2 月之前制定了计算机图形学的中心法则。用他的话来说,“计算机图形学...... . . 是空间中任意数量的点[模型]与任何所需观察位置的关联。” 他假设了观点,所以这符合我们的中心法则定义。平心而论,波音公司的费特和伯恩哈特首先实践了它。但是没有人从他们那里继承了中心法则。正如我在在线注释中详细解释的那样,它以蒂姆·约翰逊和拉里·罗伯茨在 1963 年提出的形式继承下来。59
题词中提到“计算机图形”是该重要术语的最早用法之一。在同一篇文章中,费特说:“计算机图形学[他的斜体字] 诞生于波音公司军用飞机系统部门的威奇托分公司。” 他后来澄清说,这个词最初是由他的上司使用的在波音公司,凡尔纳 L.哈德逊 (1915-2001)。到 1962 年初,我们可以放心和保守地把这个词归功于 Hudson。Fetter 确实努力推广它,并在 1962 年经常使用它。60
图 6.32
Fetter 的一个有趣的主张,特别是对于这本书,是他在 1960 年制作了第一部计算机动画电影:“[I] 制作了 60 年的第一部透视电影动画(海军驾驶舱能见度)。” 但在一份单独获得的他的电影清单中,最早的日期是“Est. 年”1962 年。A4B–F4B,航母着陆,最早与他自己的描述大致相符的是 1964 年,AMSA 驾驶舱能见度。保守的约会将第一部三维动画电影归功于 Fetter,大概是在 1962 年。
我们在“数字光的黎明”一章中了解到,已知的第一部数字动画是在 1951 年的旋风中。它们在电视上播出,但没有录制到电影中。Whirlwind 动画实际上在电视上移动,这意味着 Whirlwind 可以实时动画。最大的区别在于 Fetter 的动画是从透视的角度来看的 3D 模型,但 Whirlwind 的模型只是二维的。即使是旋风后的 10 年,也就是 1962 年,要实时观看 3D 模型移动的唯一方法就是将帧记录到电影中,然后实时投影电影。
图 6.33
在著名的贝尔实验室,Edward E. Zajac 得出了另一种透视解决方案。他于 1963 年 10 月将其提交出版,并于次年 3 月出版。根据他论文中的一个脚注,他当时已经制作了一部 16 毫米的电影,其中的三维物体在透视中移动。因此,有时人们认为他制作了 1963 年的第一部电脑动画电影。但由于费特 1962 年的电影(可能)已经存在,我们将第二部动画电影归功于 Zajac。61
Zajac 电影帧根本没有在计算机显示器上看到。它们被直接(并且缓慢地)逐帧写入电影。图 6.33 显示了运动物体的所有帧在一张图片中相互叠加。
Zajac 说:“制作透视图所需的基本转换在数学上是微不足道的。” 确实如此,而且他的解决方案在数学上等同于 Tim Johnson 和 Larry Roberts 在 1963 年使用的解决方案。但 Zajac 的解决方案,就像 Bernhart-Fetter 的解决方案一样,并没有被传给现代计算机图形学。与 Zajac、Bernhart-Fetter 和 Roberts 透视解决方案相关的详细信息显示在注释中。62
像 Steven Coons 一样,Ivan Sutherland 这个名字在计算机图形学中一次又一次地出现。我的同事 Ed Catmull 在 Sutherland 手下学习,多年来向我讲述了他。我什至和萨瑟兰在同一个房间里去过几次,但我从来没有真正了解过这个人。因此,2017 年 5 月 9 日,我在俄勒冈州波特兰市的我位于英格兰剑桥的公寓里与他进行了 Skype 通话——根据他的要求,他的时间是早上 5 点,这是他开始新一天的通常时间。
我们一起度过了一个半小时,笑声比我预期的要频繁得多。萨瑟兰并不是我所期望的那种严厉的人。是的,他最初的举止暗示了一种阴郁的性格,但我很快就发现了一丝微笑,几乎是隐藏的。偶尔会出现一些诙谐的评论——带着有趣的一口。他对我的开场白提醒我,Sketchpad 的发展发生在笨重的恐龙计算机时代,这个时代充满了电子塔。他告诉我,他必须步行穿过TX-2 才能在 Sketchpad 上工作。
麻省理工学院的 TX-2 可能是当时世界上最强大的单用户计算机。它的家是林肯实验室,一个高度安全的秘密设施(再次,一个军事暴君提供掩护)。但作为林肯实验室的员工和麻省理工学院的学生,萨瑟兰可以接触到这只野兽。他必须自己使用它,就好像它是他自己的一样。满屋子的电子设备只对他有反应。TX-2 是他自己的私人霸王龙,带有图形显示器和光笔。萨瑟兰可以用笔操纵显示器上的点。
他将线段模型存储在 TX-2 的内存中,并编写了一个程序,将这些不可见的二维模型渲染为可见的二维TX-2 的光栅书法杂交显示器上的图片。如果他让光笔悬停在显示器上的某个点附近——比如线段的末端——那么他可以抓住端点并将其移动到新位置。存储在内存内部模型中的端点坐标会发生变化。显示屏将显示更改模型的更新图片。
萨瑟兰还首次展示了橡皮筋。他会抓住线段的一端并将其拖到新位置。旧线段消失,因为新线段被立即绘制到新位置。因此,随着他移动光笔,线段被重新绘制。它会随着新端点的需要和用户指示的任何方向延长或缩短。该技术及其效果令观众惊叹不已。现在看起来很明显,但以前没有人见过。
Sutherland 的二维 Sketchpad 强调了几何约束的力量以及对他的模型进行应力分析和其他物理测试的能力。这使 Sutherland 直接进入了计算机辅助设计开发的主线。
麻省理工学院三巨头的另一位成员蒂姆·约翰逊(Tim Johnson)对我来说,可以这么说,萨瑟兰是这样看待的。我在下面的故事中保留了工程(计算机辅助设计)的讨论,这也让我们想起了 Coons 的影响:
史蒂夫库恩斯出现了一晚。. . 第一次看到 Ivan 的图形约束在起作用。Coons 被“恒定长度”约束收回,该约束固定了行长。他 [库恩斯] 随便注意到。. . 他可以绘制一个桁架并显示应变,只需为每条受约束的线添加一个文本显示,以显示该线正在经历的拉伸/压缩量。伊万从来没有预料到会有这样的用途。他为下一个演示添加了文本,史蒂夫开始绘制经典结构来测试它。那一刻标志着伊万工作的巨大力量。65
抛开限制不谈,Sketchpad 中的图形显示水平按照今天的标准似乎几乎是微不足道的,但在 1962 年没有人见过这样的东西。或者他们见过吗?像往常一样,一项技术的历史并不像收到的版本那么简单。与此同时,还有另一个交互式计算机图形和计算机辅助设计程序正在开发中。计算机增强设计 (DAC-1) 是在 IBM 的帮助下创建的,仅供底特律通用汽车公司内部的设计师和工程师使用。它的合同已出租(授予的法律术语)) 于 1960 年在纽约金斯敦的 IBM 进行开发,直到 1963 年 4 月 IBM 将该系统交付给 GM。它始终是一个三维系统。GM 知道 Sketchpad,但认为二维线段不足以满足其设计目的。他们需要三维曲线。66
起初并没有推动系统公开。也就是说,直到 1963 年 Sketchpad 和 Sketchpad III 出版。通用汽车很快得到了 1964 年出版的 DAC-1 来分享在荣耀中。但很少有人记得它或它的作者 Edwin Jacks、Barrett Hargreaves 和许多其他人。67
在我准备本章时,Barrett Hargreaves 自己告诉我:
是的,您可以使用光笔输入线段。设计师可以输入两个位置并要求它们之间有一条直线。或者有一些计算机图形对话程序可以让他开发曲线。例如,他可以输入现有的 3-D 表面,并将线或表面与该表面或与原始表面的给定距离相匹配。最终结果可能是驱动数控机床的磁带。
DAC-1 系统是一个非常早期的开发,它聘请了工程师和设计师与 GM Research 的计算机专家和数学家一起工作。工程师告诉我们他们需要什么,我们对他们的要求进行编程响应。工程师确实使用 DAC-1 来设计车辆部件,主要是引擎盖和挡泥板等车身部件。
DAC-1 对 GM 最重要的贡献可能是,在 1960 年代初期,它向 GM 工程师和 GM 工程管理人员证明了计算机图形可以有效地用于设计和工程。计算机用于燃油经济性计算、车辆操纵计算、凸轮应力分析等的案例很多,但 DAC-1 证明,使用计算机可以极大地协助车身部件和其他面向图形的工程。68
根据哈格里夫斯的说法,通用汽车与麻省理工学院合作开发了 DAC-1 和光笔的软件。麻省理工学院和通用汽车集团会互相了解。这里有一些涉及 DAC-1 的有趣历史线索,值得进一步调查。DAC-1 帐户中缺少的一件事是确切的日期。比如,画板只有二维线条图的时候,有没有三维曲线?在约翰逊的画板 III 之前它有 3D 交互图形吗?DAC-1 于 1963 年 4 月的交付早于 Sketchpad III 于 1963 年 5 月的出版,这表明它确实如此,但这些都是外部日期,不一定表示内部发展。我们确实知道 DAC-1 没有透视显示。69
哈格里夫斯还提供了以下惊喜——通用汽车公司的早期计算机动画的证据显示给沃尔特迪斯尼本人,但不是在 DAC-1 上:
沃尔特迪斯尼在 1960 年初的某个时间访问了通用汽车研究实验室计算机技术部。一位名叫 Hugh Brouse 的计算机图形程序员同事为迪斯尼先生开发了一部米老鼠的自动化电影。迪斯尼先生着迷了。当他在我们小小的计算机部门走来走去时,我们都目瞪口呆。70
同样,日期很柔和,缺乏细节。休·布鲁斯去世了。因此,如果没有确凿的证据证明并非如此,并使用我们保守的约会计划来确定优先级,让我们假设此后在 Sketchpad 与 DAC-1 的比赛中,萨瑟兰是第一名。毫无疑问,他的 Sketchpad 广为人知,而 DAC-1 却没有。但同样清楚的是,DAC-1 几乎同时是一个交互式计算机辅助设计程序。71
但是,如果我们给他,萨瑟兰首先做了什么?它不是交互式计算机图形。十年前,克里斯托弗·斯特拉奇(Christopher Strachey)和他的草稿(跳棋)电子游戏以及桑迪·道格拉斯(Sandy Douglas)和他的三字棋(井字棋)电子游戏已经做到了这一点。1950 年代早期的这两个程序都允许用户交互地更改,例如,将一个空的棋盘正方形更改为一个持有 X 或 O 的棋盘。更新了内部棋盘模型,并重新绘制了显示以显示新棋盘配置锯齿状地呈现 Xs 和 Os。
这确实是 Sutherland 的创新:Sketchpad 交互式渲染,强调渲染。当您移动您的手时,该程序会以交互方式更新内部几何模型。但 Strachey 和 Douglas 的游戏也做到了这一点。重要的新事物是 Sketchpad在您移动您的手时将更新的模型呈现到显示器上。它不仅改变了模型。它也重新渲染了它。画板不知道下一条线可能在哪里绘制,不知道它会多长,也不知道它会处于什么角度。它必须像用户的手移动端点位置一样快地渲染它。因此,用户在交互式地更改几何模型方面具有完全的代理感。
Strachey 的草稿程序在曼彻斯特古老的 Mark I 计算机上运行,显示了预渲染的几何元素——棋盘、Xs 和 Os。Mark I 的速度还不够快,甚至无法以交互速度渲染 X。道格拉斯在剑桥古老的 Edsac 上跑步的 noughts 和 crosss 也同样处于不利地位。但是大约10 年后,麻省理工学院的 TX-2速度足够快,可以瞬间渲染几十条线段,无论如何都是人类所感知的。
Sutherland 拥有巨大的 TX-2,并且是第一个以图形方式利用其速度的人。我们已经讨论过橡皮筋。他还让 Sketchpad 做一些事情,例如保持线段的一个端点固定,同时围绕它旋转另一个端点。效果是旋转线段——正如你所看到的——而用户(萨瑟兰)在显示器表面上移动光笔。或者他可以在旋转旋钮的同时实时旋转由多个线段组成的整个对象。这款游戏与 1950 年代初期的互动游戏的主要区别在于,线段的渲染是瞬间发生的,或者显然是瞬间发生的。Sketchpad 程序不知道新线段可能位于何处,因此无法预渲染它们。
Sutherland 使用 Sketchpad 完成的是第一个交互式渲染的计算机图形。它不像 Sutherland 和 Sketchpad 经常被认为的“第一个交互式计算机图形”那样顺利地从舌头上滚下来,但它具有准确的优势。这个概念是渲染到显示器的几何模型立即被模型的另一个渲染替换,该模型包含依赖于用户输入的变化,因此程序无法预测。TX-2 是第一台具有足够快显示屏的单用户计算机,而 Sutherland 则跃跃欲试地采用了这种方式。
但是 Sketchpad 有一些新的东西:交互式渲染使之成为可能但没有解释的东西;在这个交互式渲染的讨论中还没有捕捉到一些东西。好奇的?新的东西是这样的:用户自己感觉好像他(通常还不是她)正在通过“触摸”显示器上的图片来改变模型。我们称之为图片即界面的概念。早期的交互式棋盘游戏通过打字来交互地改变内部模型,而不是通过触摸图片本身。早期的 Edsac 游戏“羊与门”通过挥手中断 Edsac 纸带阅读器的光束来工作。但是作为Sketchpad的用户,新的体验是你自己通过触摸来改变图片. 如果您是设计师,您可以第一次在创建模型时看到它。DAC-1 几乎在同一时间允许同样的事情。
我在这里非常宽松地使用“触摸”,包括将光笔或光枪靠近计算机显示屏。由于使用鼠标进行光标操作对我们来说就像用光标触摸某物一样,所以我也将该模式包括为触摸。同样,我还包括通过在触摸板上移动轨迹球、操纵杆、手指或在虚拟现实中挥动魔杖来进行光标定位。
实际上用一根或多根手指触摸屏幕,就像我们今天在手机和触摸板上所做的那样,似乎是过去十年左右的一个相当新的发展。但事实并非如此。由伊利诺伊大学的 Dan Alpert、Don Bitzer 和其他人策划的 Plato 项目从 1972 年开始让用户直接触摸其等离子面板显示器。这些二进制光栅显示器的显示元素以发出橙色的光而闻名。最近出版的这个项目的历史, Brian Dear的 The Friendly Orange Glow,应该会在现代计算历史中重建柏拉图的发展。72
在我向人们展示现场演示之前的早期,我会描述在桌面上移动鼠标是如何改变显示器的。我会在每次谈话中花大约 15 分钟来解释这确实有效。人们感到惊讶的是,如果你在一个地方移动并导致另一个地方的光标以严格的模仿方式移动,你会感觉好像你是在显示器上移动,而不是在桌面上移动。1980 年代初个人电脑的出现消除了这个问题。突然之间,每个人都从个人经验中知道了鼠标是如何连接到光标的。
无论您是通过移动鼠标还是通过实际触摸屏幕来使屏幕上发生某些事情,您都认为您的手是改变画面的代理。感觉是这样,但实际情况并非如此。实际发生的情况是:“触摸”设备导致向正在运行的程序发出命令——Sketchpad 说。该程序使计算机内存中的几何模型更改,然后这会导致更改后的模型重新显示(重新渲染)到刚刚“触摸”的显示。
从今天的角度来看,使用二维几何——例如正方形、三角形或圆形——听起来并不多,但萨瑟兰首先出现了,他必须解决无数问题。他必须创建一个数据结构来表示模型中对象的拓扑结构:这条线段连接到那个线段,并在运动过程中保持连接。
当 TX-2 进行 Sketchpad 工作时,他必须让显示设备显示物体的图片。也就是说,他必须考虑一个与主计算进程分开运行的显示进程。这就是现代显示器的工作原理,但萨瑟兰不得不直面它。
他必须创建一种算法,将线段作为一组点呈现到显示器上。这与 1962 年 Bresenham 的著名算法做同样事情的时间大致相同,但 Sutherland 独立解决了它并且不考虑效率,因为 TX-2 非常快。
他必须弄清楚如何在显示器上跟踪光笔。他之后的人,比如蒂姆约翰逊,可以从许多已经解决的问题开始。仅二维几何听起来并没有多大贡献,但 Sutherland 还首次创建了交互式渲染计算机图形的管道(可能还记得 DAC-1)。
对于计算机辅助设计,他贡献了约束、拓扑保存、准确性和对象测试等重要概念,我们在此不再赘述。73
但最重要的是,萨瑟兰向我们展示了通过“触摸”它的显示屏并看到某些东西瞬间发生变化的感觉来控制计算机的力量。萨瑟兰可能并不完全是第一个,但几乎没有人看到,甚至不知道更早的例子。例如,圣人是最高机密。DAC-1 是通用汽车内部的。但麻省理工学院在营销方面很聪明。画板的电影演示被广泛传播。您仍然可以在 YouTube 上观看 Alan Kay 讲述(事后)1962 年 Sketchpad 的电影演示,感受最初的兴奋。光是橡皮筋就足以震惊世界,在当时肯定是新事物。74
在 Sketchpad 中这种交互性的使用似乎是我们现在所说的图形用户界面的戏剧性起源。我在 Skype 通话中向 Sutherland 询问了这个问题。他还没准备好走那么远。他的程序允许用户通过光笔通过“触摸”来控制物体的图片。
给我们完整的图形用户界面的最后一个比喻是用户可以通过触摸显示器来控制任何东西,而不仅仅是几何图形的图片。对象。在用户触摸下发生变化的内部模型可以是,例如,用户计算机的文件或文件夹系统。文件夹的图标是计算机内存中实际文件夹的显示版本。它不是它的图片,因为那里没有任何东西可以用来制作图片。移动文件夹的图标实际上会将文件夹移动到内存中的某个新位置。
不幸的是,蒂姆约翰逊看起来很像 1960 年代初期的伊万萨瑟兰。他的笑容比萨瑟兰更大、更热情,但同样的头发、眼镜和窄脸。今天的许多在线照片,标题为 Sutherland 在 Sketchpad 的控制下,实际上是 Johnson 在 Sketchpad III 的控制下。当我在 2017 年 3 月下旬联系约翰逊时,他善意地接受了这种情况。他说,他现在已经辞职了。他还能做什么?我向他保证我会尽我所能扭转局面。
Johnson 的 Sketchpad III 是计算机辅助设计开发的主线。正如我们所提到的,他介绍了计算机辅助设计建模师流行的四窗格窗口布局:三个显示对象的顶视图、前视图和侧视图,没有透视图,第四个是视口,显示对象使用罗伯茨透视解决方案从任何角度和透视。
考虑一下那个视口。假设它填满了整个显示器。这就是您在每部皮克斯电影的每一帧中看到的视图。其他三个窗格,包括顶视图、前视图和侧视图,仅在设计阶段使用,以方便建模者。
在图 6.34 的左上角,Johnson(不是 Sutherland!)在 Sketchpad III 的控制之下。每个显示器的特写显示所有四个窗格,视口位于每个窗格的右上角。Tim 从一个简单立方体的三个面开始(在右上图)。然后,他使用光笔在正面 F(左下方)的顶部添加了一个三角形,当他添加它时,该三角形会显示在其他窗格中。然后,他在侧面 S 上添加(右下)一个倾斜的矩形,并且可能在正面 F 上添加另一个矩形。75
视口是 Johnson 的创新:“Ivan [Sutherland] 通过将我指向拉里·罗伯茨的方向来实现同质化。我很快就意识到他(罗伯茨)的方法是多么干净(和出色)。. . . 透视视口是我的想法。” 而那个(透视)视口概念是计算机图形学的关键。76
我问约翰逊,他是否在 Sketchpad III 中实施了 Coons 补丁,因为 Coons 是他的硕士论文导师。“我将史蒂夫的补丁作为一个快速而肮脏的独立 TX-2 程序,它不是 Sketchpad III 的一部分。” 77
图 6.34
从那些早期开始,他对自己做了什么?约翰逊在 Sketchpad III 之后从事建筑事业。在麻省理工学院建筑系,他将萨瑟兰的约束思想应用于建筑规划,并在那里获得了教授职位。然后他在麻省理工学院校园建造了一座示范太阳能建筑。他通过创办一家成功的企业结束了他的职业生涯,该企业对建筑进行了程式化的“照片级写实”渲染。也就是说,约翰逊在 Digital Light 的计算机辅助设计分支开始了他的职业生涯,并在计算机图形分支中结束了他的职业生涯。但他从未获得过任何一个奖项。78
拉里·罗伯茨看起来不像他在麻省理工学院的同学伊万·萨瑟兰和蒂姆·约翰逊。他的头发较黑,没有戴眼镜。而且他没有写过 Sketchpad 的版本。事实上,他并不是从计算机图形学开始的。罗伯茨最初在 Digital Light 的图像处理部门工作。他研究了一张花花公子杂志的照片,在作为像素栅格的数字形式,以了解他可以省略每个像素多少位并仍然保持图像质量。
但他更令人印象深刻的作品涉及识别数字化照片中的 3D 形状——不是花花公子兔子,而是透视拍摄的立方体和棱镜等简单物体。他通过检测这些物体的直线边和角提取了这些物体的线条图,同时考虑了透视。然后他推断出它们的三维结构并将其显示在 TX-2 显示器上,然后又回到 Digital Light 的计算机图形分支进行这部分工作。他必须掌握透视才能做到这一点,而他这样做的方式成为他对计算机图形学的基本贡献。79
他的透视解决方案在当今的计算机图形学中普遍使用。它来自一个名为射影几何的深奥数学,它利用了奇怪的齐次坐标。这不是一个明显或直观的步骤。
该技术要求我们将第四个坐标附加到几何中的每个点。我的高中教科书的平面几何使用具有两个坐标的点,第一个用于水平位置x,第二个用于垂直位置y。这就是萨瑟兰画板的几何形状,无论是内部还是展示。
像我这样的学生在高中也学了一点立体几何或三维几何。它将第三个坐标附加到每个点,它在三维空间中的深度位置z 。立体几何是 Johnson 的 Sketchpad III 的内部结构。为了显示,Johnson 只需要二维点,但在他最有趣的转折中,他让 Sketchpad III 也以透视的方式显示内部模型。这就是他的同学罗伯茨的透视解法发挥作用的地方。
罗伯茨技术将奇怪的第四个“同质”坐标附加到内部模型中的每个点。我们称之为h。罗伯茨世界中的一个缩略点——在射影几何中——变成了 ( x , y , z , h )。前三个坐标只是空间中一个点的通常位置。但是第四个坐标是什么?我们已经讨论过时空,其中一个点具有第四个坐标,即它的时间位置。但是齐次坐标不是时间。它的意思是:给定一个通常位于内部几何模型中 ( x , y , z ) 的点,使用该点 (x / h , y / h ) 以在模型显示的透视图中定位该点。换句话说,透视一个点的方法是将它的前两个坐标除以它的第四个坐标h(并且简单地忽略第三个坐标)。这并不明显,是吗?文艺复兴时期的艺术家和建筑师当然不知道这种算法。
但罗伯茨走得更远,约翰逊也将这些其他想法融入到 Sketchpad III 中。罗伯茨介绍了当今计算机图形学中普遍使用的空间转换机制。我们所说的空间变换是指移动、旋转或调整对象大小。除了说它在 Roberts 用他的透视解法引入的四维点上使用四维乘法外,我不会进一步解释它——其中第四个坐标是齐次坐标。进一步解释将带我们进入“矩阵”代数的数学杂草。关于罗伯茨要记住的重要一点是,他以矩阵形式将透视和空间变换结合在一起,就像我们今天普遍采用的那样。他没有创建齐次坐标或矩阵代数。但是将两者结合起来是深刻的。以下是罗伯茨自己的发现:
事实证明,当时在美国或世界上都没有整合矩阵和透视几何的技术。不知怎的,两人在整个世界的时间和空间上完全分开了。所以我回到了德语教科书,发现透视几何是如何完成的,并且没有矩阵知识。当然,我去其他教科书上找到了有关矩阵的知识,然后将两者放在一起,创建了四维齐次坐标变换,今天广泛用于透视变换。这篇论文甚至可能是最初论文中所有工作中最为人所知的,因为它提供了一个单一的四维变换,可以对物体进行任何透视显示。80
为什么没有罗伯茨奖?拉里·罗伯茨怎么了?你可能会感到惊讶。他成为互联网发明背后的主要力量!但这是一个需要背景的故事。
您可能还记得,JCR Licklider 在他 1960 年的“人机共生”论文中设想了互联网。因此两年后 ARPA 抢购“Lick”并让他成为新信息处理技术办公室的第一任主任也就不足为奇了。在一系列强有力的领导者的领导下,IPTO 将成为我们故事中的一支主要力量。特别是,它将刺激互联网、个人计算机和计算机图形学的发展。
Lick 立即开始资助项目,这些项目可能会实现他关于人与机器和谐工作的愿景。他在这方面非常自由,并获得了真正的远见卓识。他资助的第一批项目之一是 Doug Engelbart 在斯坦福大学附近的斯坦福研究所的“增强型”人机通信项目。这个项目导致了图形用户界面的第一个完整实现。如前所述,恩格尔巴特在著名的“所有演示之母”中展示了这一点——他用一种叫做鼠标的新设备来驱动它。
NASA 的罗伯特·泰勒同样对恩格尔巴特感兴趣,也投入了资金。形成了一个有远见的联系——ARPA 的 Licklider、NASA 的 Taylor 和 EngelbartSRI——谁会影响这个技术爆炸性十年和下一个十年的所有相互交织的故事。
Licklider、Engelbart 和 Taylor 非常了解 1962 年至 1964 年在麻省理工学院的 Triumvirate 的 Sketchpad 和 Sketchpad III 开发。他们引用它们作为他们集体人机视觉的证据。毫不奇怪,ARPA IPTO 的第二任主任是 1963 年的 Ivan Sutherland。第三任主任是 1965 年的 Bob Taylor。第四任主任是 1966 年的 Larry Roberts。ARPA 的资金帮助这些人不仅影响了 Digital Light,而且影响了肤色我们整个现代世界。
在 Ivan Sutherland 在 IPTO 工作期间,他继承并继续资助伯克利的 David Evans。当埃文斯随后在犹他州成立图形部门时,他敦促萨瑟兰加入他的行列。Sutherland 终于在 1968 年这样做了,同时两人在盐湖城共同创立了计算机图形硬件公司 Evans & Sutherland。该公司,尤其是该部门将对随后的计算机图形学历史产生巨大影响。
1970 年,鲍勃·泰勒(Bob Taylor)在 IPTO 分配 ARPA 资金后,在施乐 PARC(帕洛阿尔托研究中心)创立了著名的实验室。几年后我会在那里为他工作。这是创建我们现在所理解的个人计算的实验室,它集成了个人计算机、基于 Windows 的图形用户界面、鼠标、激光打印机、光栅图形和以太网。
拉里·罗伯茨(Larry Roberts)利用他在 ARPA 的 IPTO 领导职位创建了后来成为互联网的 ARPAnet。互联网现在是使用在施乐 PARC 的泰勒实验室发明的以太网组件来实现的。ARPAnet 上最早的四个节点中有两个是斯坦福研究所和犹他大学。
在我撰写本章的初稿(2017 年 4 月)时,罗伯茨被选为加州计算机历史博物馆的研究员。他的官方介绍没有提到他在计算机图形学及其中心法则中的创始角色。他因在创建互联网中所扮演的角色而备受赞誉——这对任何人来说都是足够的成就。仅 IEEE 就获得了 1976 年的 Harry M. Goode 纪念奖、1990 年的 W. Wallace McDowell 奖和 2000 年的 Internet 奖。他是美国国家工程院院士,2001 年授予他查尔斯奖斯塔克德雷珀奖。但他从未因其对计算机图形学的基本贡献而获得同样的荣誉。81
动画是本书的一个持续主题。尽管萨瑟兰主要以计算机辅助设计而闻名,但他在 1963 年的画板中暗示了动画论文。图 6.35 是论文的一部分,是一个女孩和她眼睛的三个位置的简单绘图。这个概念是,如果你连续替换三个眼睛位置,她会眨眼。值得引用萨瑟兰的话说,看看我们已经走了多远:
图 6.35
卡通化的一种方式是替换。例如,显示的女孩“Nefertite [原文如此]”。. . [上图]可以通过改变三种眼睛中的哪一种放在她原本没有眼睛的脸上的位置来眨眼。在电脑显示器上这样做让许多参观者感到很开心。
第二种卡通化方法是通过运动。通过适当地应用约束,可以制作一个简笔画来踩自行车。类似地,Nefertite 的头发也可以摆动。这是电影中更常见的卡通形式。82
萨瑟兰错误地认为,这种第二种形式,通过受约束的运动,在电影中很常见。Cel 动画使用了中间形状的替换,直到千禧年它都是常用的形式。即使在今天,它仍然是通常的形式,如果用替换来表示在三个维度上的中间形状的插值。
在完成 MIT 论文后,Sutherland 加入了 ARPA 并资助了正如我们所见的 David Evans。然后他从 ARPA 辞职,去了哈佛几年,并于 1968 年加入了 Evans 创立的犹他大学计算机图形系。许多现代计算机图形学研究人员从该系毕业,每个人都讲述了萨瑟兰的首要地位的故事。尽管 Sutherland 没有直接从事动画,但犹他州的毕业生对于接下来章节中介绍的计算机动画行业来说是基础。
除非他阅读了与所有作品相关的所有注释,否则任何参观展览的人都不会知道他正在看的是艺术家、工程师、数学家还是建筑师制作的东西。
—Jasia Reichardt,Cybernetic Serendipity策展人,1968 83
贝尔实验室是我们在 1963 年观看 Edward Zajac 的计算机动画电影的所在地。它也是早期计算机动画制作系统的所在地。1964 年,贝尔实验室的研究员 Ken Knowlton 设计了一种计算机语言,用于以光栅模式缓慢生成电影,一次一帧地拍摄。它后来被称为 Beflix。它不是交互式的。它假设一帧在“高分辨率”模式下被分成 252 x 184 个小方块。“在打字机模式下”的小字符可以写到每个方块上。相机是散焦的,因此角色是不同强度的斑点。也就是说,它们是粗略的散布像素,在网格上且没有重叠。一部由诺尔顿在 1964 年以这种方式制作的原始电影可以在网上看到。Zajac 和一名学生在 1964 年和 1965 年使用诺尔顿的语言制作的一个,也可以在网上看到。84
锣声在此响起。艺术家们开始与贝尔实验室和其他地方的技术人员合作。这些是受过艺术家训练的艺术家,而不是计算机科学家,他们嗅到了空气中的新事物。他们是一个新品种,他们将计算视为一种可以在雕塑、音乐、诗歌和绘画艺术中探索的新鲜物质。我们在下一章中再次见到的一位是斯坦·范德贝克,他是一位实验电影制作人,他在 1960 年代在贝尔实验室制作电影,与肯·诺尔顿合作。
这是著名的六十年代,定义受到质疑。一些计算机科学家将自己视为艺术家,这在艺术界引起了沮丧。争论直到今天,我不会在这里解决它们。Ken Knowlton,无论你称他为艺术家与否,都开始了一生对各种展示元素的实验。他使用任何东西——多米诺骨牌、骰子、玩具车和贝壳——创作了数十张数码照片,以传播他的像素。1990 年代,在他的第一部电影之后 34 年对于散布像素,Knowlton 仍然在介质中工作——使用茶壶碎片作为显示元素(图 6.36)。85
图 6.36
这不是茶壶,© Ken Knowlton,1998 年。Laurie M. Young 收藏。
尽管 1960 年代后期的许多人不认为计算机是一种艺术工具,但有一位女士认为,她 1968 年的展览已载入史册。Jasia Reichardt 的开创性展览 Cybernetic Serendipity于当年在伦敦开幕。图 6.37 中的目录封面(左)和海报(右)现在是收藏品。即便如此,她还是小心翼翼地避免称作品的创作者为“艺术家”。五十年后,这在某些圈子中仍然是一个雷区,实际诉讼悬而未决。86
但是 Robin Forrest 没有问题地避开这个术语,尽管他在图 6.37 海报的右侧贡献了扭曲的线框补丁。“我从不认为我的形象是艺术,但她 [Reichardt] 做到了。所以,一定是艺术!但为什么是那个图像?” 87
2005 年,Reichardt 采用了间接的方式来描述创作者,他重复了另一位作者的话:
他还指出,1967 年存在的大部分照片主要是出于业余爱好,他讨论了 Michael Noll、Charles Csuri、Jack Citron、Frieder Nake、乔治尼斯和惠普帕特森。作为计算机艺术史的先驱,我们今天对所有这些名字都很熟悉。. . . 计算机诗歌和艺术的可能性在 1949 年首次被提及。到 1950 年代初,它已成为大学和科学机构的话题,当计算机图形学问世时,艺术家已成为科学家、工程师、建筑师. 88
图 6.37
© Cybernetic Serendipity,1968 年,由 Franciszka Themerson 设计。
本章中的人物,除了罗宾福雷斯特(也作为《控制论机缘巧合》的创作者)之外,还有威廉·费特、肯·诺尔顿、斯坦·范德贝克和爱德华·扎亚克。89
随着鳄鱼开始在 TX-2 屏幕上嬉戏,图片驱动的动画成为现实。
——Ron Baecker,博士论文,麻省理工学院,1969 90
在我的讲述中,Ronald Michael Baecker 是麻省理工学院 TX-2 计算机的第四个主要受益者。他直接受到前三个中的两个,伊万萨瑟兰和蒂姆约翰逊的影响。我记得六十年代色彩缤纷的贝克尔是一个穿着 dashiki 的加拿大人,有一个很酷的新节目。91
1966 年末,贝克尔在 TX-2 上开始了一个简笔画动画程序——一台 Epoch 1 机器。然后,他开始与来自哈佛卡彭特视觉艺术中心的迷人而有才华的动画师 Eric Martin 合作,掌握动画动态的控制。这项工作的灵感来自 Sutherland 和 Johnson 使用“波形”来控制运动的建议。结果是 Genesys ,用于 Generalized-cel 动画系统。92
Baecker 将波形概念推广到他所谓的“p 曲线”。这些曲线定义了通过时空改变位置的路径,而不是定义角色形状的曲线。如果他想让狗跳起来,他会在显示器上画一条曲线来显示时间的运动——他实际上是在时间上画出跳的。然后一幅狗的画就会沿着这条路走。如果路径是一跳,那么狗就跳了。如果他用一张女士鳄鱼的画代替狗,那么“没有鳄鱼”的人就会跳起来。Baecker 于 1969 年完成了 Genesys,使其成为最早的交互式计算机动画程序。93
但据我的老朋友兼同事、新泽西素描艺术家 Ephraim Cohen 说,Genesys “当时让大多数艺术工作者感到困惑”。以法莲非常擅长素描,有时他可以在服务员为他服务的时候画一个女服务员的肖像来免费用餐。他会毫不费力地捕捉到她的个性。
在最近的一封电子邮件中,Ephraim 告诉我,“我是由一位共同的朋友 Lynn Smith 介绍给 Ron 的,他当时是哈佛大学卡彭特中心的动画师。林恩和我是高中的朋友。罗恩正在寻找使用他的动画系统的人。” Ephraim 是一位数学家、程序员和艺术家,他并没有被 p 曲线弄糊涂。他解释说:“我很适合,所以我们被介绍了。这一切都是在林肯实验室的 TX-2 上完成的。另外,我在那里玩了一个下午玩Spacewar。我做的动画并不多。我想这一切都在两天内完成。”
他帮助 Baecker 制作了第一批 Genesys 动画作品,尽管该系统的绘图功能(参见图 6.38 中的研究)远远不能充分体现 Ephraim 的素描技巧。在接下来的章节中,我们将再次遇到 Ron Baecker、Eric Martin 和 Ephraim Cohen(分别是程序员、动画师和艺术家)。94
Baecker 的波形或 p 曲线类型的动画不是通常的动画,这就是它令人困惑的原因。Genesys 并没有像传统的在关键帧之间的 cel 动画中那样进行插值,也没有像 Baecker 所说的那样对“关键帧”进行插值:
当关键动画师要求他的助手填充中间到一对关键帧的图片时,就会发生插值。有人建议这个过程的一部分可以机械化。我们不会在本文中进一步考虑这个问题。95
然而,我们确实在这里进一步考虑插值。那是下一个。
图 6.38
2016 年 6 月 12 日,Marceli Wein 和他的妻子 Susan 在安大略省南部我公婆的农场接我,然后驱车前往 Gananoque,在那里我们登上了一艘摩托艇,前往他们位于千岛群岛之一的家中。在圣劳伦斯河。那是一个寒冷的日子,所以我们围坐在壁炉旁,在经历了 40 年的不同方向之后,继续各自的生活。这位绅士给我讲了一个最神奇的故事:
还记得史蒂文·斯皮尔伯格的电影《辛德勒的名单》(1993),它告诉我们一个贪婪的德国商人奥斯卡·辛德勒如何在奥斯威辛集中营从纳粹恐怖中拯救了一千多名犹太人?好吧,Marceli 的父亲 Wolf Wein 是一位裁缝大师,在这份名单上排名第五。但在这些事件发生之前,沃尔夫·韦恩救了他 8 岁的儿子马塞利。用马塞利自己的话来说:
1943 年春天,我因猩红热被送往克拉科夫隔都的一家医院。. . . 我父亲听说医院要关闭,里面的每个人都会被杀。那天晚上他来找我,把我裹在毯子里,然后偷偷带我出去。. . . 我记得我和我父亲以及一群犹太工人走出去,他们从贫民区到一家奴工工厂。在路上,他把我交给了沿途等候的一位女士。接我的人是一位漂亮的女士,Zofia Jezierska,我后来称她为姑姑。我和她一起去了克拉科夫的一个公寓。几天后,我和她一起搬到了华沙。我现在是一个“隐藏的孩子”。96
Zofia 将 Marceli 培养为罗马天主教徒,并以 Marek Czach 为名。与此同时,他的哥哥被枪杀,他的母亲死在集中营。但多亏了辛德勒,他的父亲沃尔夫幸免于难。他和马塞利最终于 1952 年团聚并定居在蒙特利尔。
Marceli 在那里的麦吉尔大学学习,并在攻读博士学位期间接触到了计算机成像的潜力。1966 年,他加入了加拿大国家研究委员会的 Nestor Burtnyk,从事早期计算机图形研究,这让他兴奋不已。“我们对非技术人员如何与计算机交互感兴趣。” 97
Burtnyk 在 1969 年的计算机图形会议上听取了迪斯尼动画师的演讲。动画师解释了我们之前在电影章节中讨论的 cel 动画过程: 动画师用铅笔轮廓绘制关键帧。然后中间帧,关键帧之间,由中间帧创建。Inkers 将印度墨水中的铅笔线描摹到 cels(赛璐珞片材)上,而遮光剂则用颜色填充轮廓。Burtnyk 和 Wein 决定使用计算机创建一个 cel 动画助手。
Burtnyk 编写了二维插值程序,该程序将在关键帧中获取一条线,在下一个关键帧中获取相应的线,并在中间帧的适当位置插入一条线到另一条线。也就是说,计算机将成为关键帧动画系统中的中间人。因此,他们在 1970 年创建了第三个记录在案的二维计算机动画系统,这是在诺顿和贝克尔之后——所有实际用于制作的系统。98
Knowlton 的 Beflix 系统是第一个完全面向像素的系统,无需插值几何。Baecker 的 Genesys 沿着曲线移动了固定的几何对象,但没有对它们进行插值。Burtnyk 和 Wein 的系统是第一个插值或中间的计算机动画系统。
Burtnyk 和 Wein 于 1996 年被评为加拿大计算机动画技术之父。他们在 1997 年获得了美国技术学院奖,以表彰他们的贡献。
摩尔定律于 1965 年问世。它的宣布开启了计算加速的第二个时代。它带来了我们现在所知道的 Digital Light 成果。
“法律”——因为它不是真正的法律——以世界上最成功的计算机芯片公司英特尔的联合创始人戈登·摩尔命名。英特尔是加利福尼亚硅谷的基石公司,其知识起源直接追溯到晶体管。晶体管导致了集成电路——单个芯片上的许多晶体管——以及摩尔定律。在摩尔定律之前,计算机变得越来越强大,因为它们变得越来越强大。之后,它们变小了。也就是说,它们变得更密集。
摩尔这样制定他的“定律”:集成电路芯片上的元件数量每 18 个月翻一番。实际上,他先是说 12,然后是 24,但是平均卡住。毕竟这是“法律”,而不是法律。这只是 1965 年的一次观察——仅基于四个微薄的数据点。99
他还预测——这只是事后看来很幽默——“没有理由相信它不会在至少 10 年内保持几乎不变。” 但它现在已经保持了55年。它已成为法律,尽管事实上没有理由以物理学为基础相信它确实是法律。100
我之前说过摩尔定律的一个方便的重新表述:关于计算机的所有优点每五年都会提高一个数量级:“10 Xin 5”很容易记住它(发音为“10 ex in 5”)。图 6.39 是 Epoch 2 的图片,左侧是 1965 年的第一年。
脚踏实地的商界称摩尔定律曲线为“曲棍球棒”。这是一个值得死去的利润图表。以显示的最后一个角度延伸曲线(接近垂直)以查看曲棍球棒。这是一个指数增长的画面。指数意味着爆炸。摩尔定律描述并预测了指数级增长计算速度或内存密度,或者成本和大小的指数级下降——计算机的所有优点都会以指数级的方式变得更好。
图 6.39
摩尔定律是推动世界的阿基米德杠杆。人类能力的放大在第一纪元达到百万倍。然后摩尔定律在第二纪元中利用了另一个千亿倍——到 2025 年将达到万亿倍。自计算机发明以来,人类能力的放大将达到五亿分之一到那时折叠——18 个数量级!这是不可想象的 - 和愚蠢的 - 像天翻地覆一样,但它是真实的。
任何现代计算方面的历史——尤其是数字光——都不能忽视摩尔定律的巨大作用。这是过去五年中所有特定发现和进步的爆炸性背景——没有它,其中大多数都是不可行的。随着我们在接下来的章节中继续阅读像素的传记,摩尔定律所扮演的角色将越来越明显。在这种情况下,概念的谱系并没有脱离历史时间——脱离摩尔定律时钟的沉重滴答声。
我们也不能忽视当前的滴答作响。“定律”仍在发展超新星。事实上,它正在超越。一颗超新星的亮度可以比它的起源恒星亮 100 亿倍,但计算机很快就会比原来的机器强大一万亿倍——仅在 Epoch 2 中——。掌握摩尔定律的最高级概念,无论多么微不足道,都是理解计算和计算机以及数字光的核心。
我们已经看到了摩尔定律到底是什么——但为什么会这样呢?部分答案是,实现比特没有迫在眉睫的物理障碍。它只是某种东西的存在或不存在——比如电压。它没有大小。这只是一个区别,仅此而已。这是纯粹的信息。答案的其余部分必须反映人类可以创新的最大速度。给定技术的指数级改进——计算机芯片技术中的摩尔定律——衡量一大群有创造力的人在竞争下改进技术的最终速度,当没有最终的物理障碍阻碍它的改进时当技术必须以自己的方式付费时。
从表面上看,摩尔定律是一个谜。如果我们相信它,那么我们为什么要为干预步骤而烦恼呢?如果我们知道计算机将在三年内提高四倍,为什么还要先建立两倍的提高倍数呢?如果我们知道计算机将在 10 年内提高 100 倍,那么为什么还要为 5 年内只有 10 个版本的因素而烦恼呢?为什么不直接去更高的因素?
这个问题的极端形式使其荒谬性显而易见。如果我们在 1965 年就知道计算机在 2020 年会好上一千亿倍——就像现在一样——为什么我们是否费心制造在 1970 年好 10 倍、在 1975 年好 100 倍、在 1980 年好 1000 倍等等的计算机?为什么我们不直接开始制造 2020 年的机器,跳过所有年份和 pokey 机器之间的时间?这种形式的问题显示了缺陷。1965 年,假设我们对新的“法律”有信心,我们根本无法想象 2020 年的计算机——更不用说如何建造它了。工程师必须到达每个级别,然后才能开始想象到达下一个级别的方法,然后创建它。我们不能跳过中间步骤。
不,我们必须遵循摩尔定律逐步改进芯片技术的路径,才能想象下一个改进可能是什么。这就像生物的进化。微小的变化最终会聚合成巨大的变化——生物的生存能力在每一步都完好无损。从细菌到婴儿不可能一步一步直接飞跃。就像在达尔文进化论中一样,摩尔定律的变化提高了拟合度——在计算机的情况下朝着更便宜、更小、更密集和更快的方向发展。在任何一种情况下,我们都看不到累积的变化将走向何方,因为没有目的论。但是,当涉及到技术时,我们会实施每一步,看看它是否真的有效,然后获得勇气、洞察力和对工程的掌握,以进行下一步。这也是我们如何评估进行下一步所必需的金融赌博的方式。我们需要知道它在可行的范围内。
摩尔定律将向我们表达的硬件现象描述为放大。曾经深不可测的变得可行,然后变得平凡。
然而,实际上,他正在检查的不是迪亚斯帕。他在记忆细胞中穿行,看着这座城市的梦幻形象。. . . 对于计算机、记忆电路和所有创造阿尔文所看图像的众多机制来说,这只是一个简单的透视问题。他们“知道”城市的形态;因此他们可以展示它,就像它从外面看到的一样。
——Arthur C. Clarke,《城市与星辰》,1956 年,摘自 Jim Blinn 的博士论文,1978 年101
当然,最终的展示将是一个房间,计算机可以在其中控制物质的存在。摆在这样的房间里的椅子足以坐下来。摆在这样的房间里的手铐会限制人,而摆在这样的房间里的子弹会是致命的。通过适当的编程,这样的展示实际上可以是爱丽丝走进的仙境。
—Ivan Sutherland,《终极展示》,1965 102
带注释的爱丽丝梦游仙境,由马丁·加德纳于 1960 年撰写,是一代人的必备读物,他们着迷于自己的心灵旅行和神奇的蘑菇。所以毫不奇怪,Ivan Sutherland 对 1965 年终极展示的描述读起来像是一个迷幻的梦——并唤起了爱丽丝。1968 年,萨瑟兰在哈佛实现了这一梦想的第一次通过,这一举动巩固了他作为 60 年代计算机图形学主要领导者的名声。他称其为头戴式显示器. 佩戴它的用户会看到一个简单的 3D 计算机生成场景,即“虚拟现实”,与用户周围的真实世界相混合。虚拟现实 (VR) 是计算机生成部分的矛盾现代造词。VR 与现实世界的混合称为增强现实 (AR),即由 VR “增加”或“改进”的现实。这两个术语都是对“现实”的奇怪看法,但一直存在。
有人认为 Sutherland 的头戴式显示器是 VR 或 AR 的首次实现。有早期的头戴式显示器,但这是第一个近乎实时地跟踪头部位置并调整虚拟场景以适应用户不断变化的视角的显示器。图 6.40 显示了它的光学系统(这个人不是Sutherland)。103
萨瑟兰的头戴式显示器远不能控制“物质的存在”,但它确实呈现了一个由直线段创建的三维世界的立体视图。这个视角是拉里·罗伯茨的视角,它结合了齐次坐标和矩阵操作。Sutherland 1963 年的 Sketchpad 没有采用计算机图形学的中心法则,但他 1968 年的头戴式显示器做到了。104
摩尔定律使 VR 成为可能。头戴式显示器的发展早在 Epoch 2 之后——在 Gordon Moore 于 1965 年制定“法律”之后。事实上,Sutherland 在他的头戴式显示器设计中使用了集成电路芯片。105
据传闻,萨瑟兰随后著名地声称,计算机图形学中的所有问题都已解决!这对于年复一年继续解决计算机图形问题的几代贡献者来说是一个惊喜,而且仍然如此——Siggraph 会议上到处都是他们的论文。在我与萨瑟兰的谈话中,他告诉我他永远不会发表那种声明。真正与他的说法背道而驰的是萨瑟兰在 1966 年写的一篇名为“计算机图形学中的十个未解决问题”的论文。但传闻中的说法与他给犹他州另一位杰出毕业生詹姆斯·卡吉亚的建议一致:
进行研究的最好方法是选择一个每个人都认为非常困难的问题。找到一种全新的方式来看待它,让 90% 的事情变得简单。解决简单的 90%。然后其他人都会努力工作 10% 并参考你。106
图 6.40
萨瑟兰本人在一个完全不同的领域转向了一个非常困难的问题。他与 Carver Mead(创造了摩尔定律一词)合作,解决了设计越来越高密度的集成电路芯片的看似棘手的问题。也就是说,萨瑟兰将注意力转向保持摩尔定律的活力和良好。今天,他仍在俄勒冈州波特兰的办公室里解决问题的一个困难方面。107
我通过描述我在 1970 年代初向 Ravi Shankar 演示的演示来开始本章。我的目的是通过使用二维情况来推动基于几何的模型的概念,并通过在样条概念中反向显示采样定理来完善采样定理的重要性。最后,样条曲线作为点的插值或近似导致补丁作为插值或曲线的近似(实际上是样条曲线)。这引入了计算机图形学的三维世界。
然后我回到旋风时代的末期,在这一章的剩余部分中,我们在纳粹和苏联的威胁以及美国对它们的大规模技术反应所催生的环境中度过了 1950 年代和 1960 年代。美国政府,尤其是 ARPA 和 NASA 提供了一个受保护和控制的世界,让计算机创新者茁壮成长。他们在受保护的环境中获得了慷慨的支持,没有通常的盈利和行业竞争负担。
因为带有彩色笔触的 Ravi Shankar 演示来自 1970 年代,所以您可能会误以为本章的其余部分(大约 1950 年代和 1960 年代)有彩色图形。但它没有。我们只是现在,在 1960 年代末期,色彩即将开花,摩尔定律发电机已准备好驱动它。
从本章中的形状和灰度图片开始,我们将在接下来的章节中学习颜色、阴影、透明度、纹理、光线、阴影等,一般归类为阴影图像。我们学习如何渲染单一颜色的阴影三角形区域,然后将其放大到完整的计算机图形荣耀。
我进一步将我们的注意力限制在计算机图形的计算机动画部分,我们最终将了解电影是如何从机器的内脏中产生的。
图 7.1
第一个彩色像素,1967 年,用于渲染阿波罗月球计划模拟器 NASA-2 中的登月舱。
时期 1 是灰色的。时代 2 是彩色的。1965 年戈登·摩尔 (Gordon Moore) 发表了他著名的“法则”后不久,Digital Light 中的色彩就出现了,这一事件拉开了第二纪元的序幕。这绝非巧合。每一个彩色像素显示器(而且有很多)都是一面飘扬的旗帜,以庆祝——不仅是为了庆祝这一事件,也是为了计算机历史的 Epoch 2 以及它给我们带来的爆炸性放大。像素在迷幻的 60 年代获得了色彩——也就是 1967 年的爱之夏和人类存在的那一年。但这只是巧合。数字色彩并不是反文化的成就。它是主流冲向月球或远离地球的结果,这取决于你如何看待它。直到写完这一章,我才发现完整的故事。1
在本章和下一章中,我将简要解释颜色的来源,然后追踪从最初的彩色像素到第一部数字电影的路径,并解释如何计算它们。令人震惊的是,这一切都发生在大约 35 年之内。但这就是摩尔定律和由此产生的放大的含义:每 5 年增加 10 倍。在那些年里,驱动数字光的发电机撕裂了七数量级的能量浪涌——一颗散发着光芒的超新星,今天的每一个屏幕以及本章和下一章的每一页都充满了光芒。第一部数字电影的创作者在这种新浪潮中冲浪,因为它在我们文明的海岸上坠毁。然而,这些电影只是世界上更大的力量在起作用的微小的彩色指标。
这本像素传记从采样的发明开始,到下一章的大数字融合结束。在这些端点之间,我打算涵盖所有数字光,但摩尔定律的本质表明,对于这样一个爆炸性大的领域,以及它的子领域数量不断增加,这本书的空间非常小。如果章节要恰当地代表整体,摩尔定律超新星将迫使更多和(指数)更多的技术进入每个连续的页面。
我的解决方案是让面向图片的计算机图形学成为整个广阔领域的最终典范。在面向图片的计算机图形学中,数字电影将代表所有其他内容。由于此处面向图片的计算机图形学代表了更大的数字光领域,因此数字电影代表了从大数字融合中出现的所有其他类型的计算机图形学——包括电子游戏、计算机辅助设计、飞行模拟器、应用程序界面,和虚拟现实。
下面是我们将如何进行。从 1965 年开始,我们开始以令人费解的数量级迈出摩尔定律的浪潮,朝着千禧年的数字大融合迈进。我们采取了五个大步骤来实现这一目标——数字电影的缩影。这些步骤被转换为两章彩色像素传记的五个子章。这两章以指数级的速度展开。子章节由摩尔定律在相应时间内起作用的因素:X1、10、100、1,000和 10,000 X—X即以五年为增量。因此,每个子章节的步骤都提醒我们摩尔定律工程奇迹的重要贡献,它赋予了一切力量。XX
我们从数字光的黎明一章中知道,像素是视野的样本。此外——这是至关重要的——它是一个已被数字化为比特的样本。在本章中,我们使用像素来采样彩色视野。自然,我们称它们为彩色像素。
我们也知道我们看不到彩色像素。它没有形状。这是一个单一点的视野样本。它在位置的数学网格上具有一个位置,并具有与之相关的单一颜色。要看到一个不可见的像素,它必须由显示设备上的显示元素扩展并添加到那里的其他扩展像素。扩展和添加重新引入了原始视野在采样之前具有的无限颜色。这只是重述了最重要的采样定理的魔力。
但是颜色是如何与像素“关联”的呢?每个显示元素都是现实世界中发出彩色光的一块物质,它必须发出数百万种不同颜色的光才能在现代世界中发挥作用。因此,必须有一个输入控件来告诉显示元素要发出多种颜色中的哪一种。
关键是像素不包含颜色。它拥有颜色控件。彩色显示元素因制造商而异,因此让我们考虑一个典型的。它由三个相邻的微小发光部分组成,每个部分都贡献三种原色成分中的一种——红色、绿色或蓝色(用于发射光)。在正常观看距离下,我们的眼睛将这些微小的独立发光部分融合在一起,形成单一的发光颜色。这样的彩色显示元件需要三个输入控件,例如电压,以改变三个发光的小部件。电压越高,主成分发光越亮。
我们对彩色像素的定义要求它必须在数字控制下显示。彩色像素中的位驱动彩色显示元件的三个数字控件。说像素存储颜色非常方便,我们有时会使用该术语。但像素实际上并不存储颜色——就像位实际上并不保存 0 和 1 一样。在下一节中,我会小心地说像素控制而不是存储颜色。
让我们回顾一下如何进行数字计数——尤其是颜色。我们之前曾使用过弱电灯开关作为隐喻。开关可以打开或关闭,类似于表示 1 或 0 的位(如果我们坚持使用数字作为名称)。所以一个1位像素只能控制两种不同颜色的显示。通常,这两种颜色是黑色和白色,但它们可以是任何两种固定颜色——比如淡紫色和黄绿色。
两个电灯开关可以处于四个不同的位置:都打开、都关闭,或者以两种不同的方式一个打开另一个关闭。因此,一个 2 位像素可以将显示元素驱动为四种可能颜色中的一种。随着像素中的位数增加一,它可以控制的可能颜色的数量增加一倍。三个电灯开关可以在八个位置,当新的第三个开关打开时,两个电灯开关的所有四种可能性,加上新开关关闭的两个电灯开关的所有四种可能性。因此,一个 3 位像素可以驱动或控制八种可能的颜色。等等。为方便起见,在提到像素大小(以位为单位)后,我经常将等量的可能颜色控制在括号中。
当位数达到六位及以上时,彩色像素变得严重。存储像素颜色控件的明显位置就在这些位中。事实上,这种直接存储是当今最常用的方法——这就是为什么像素存储颜色的概念看起来如此自然的原因。
但是在内存非常昂贵的早期,存储颜色控件的间接方式很流行。它使用所谓的颜色图或颜色查找表。像素中的位被解释为存储在计算机内存中其他位置的颜色控制表中的行号。那行内存位(不是像素位)控制颜色。这个想法是保持每像素的位数很小——因为有这么多的像素——同时使每像素可能的颜色选择的数量很大。
考虑已经提到的 1 位像素。一位可以直接打开或关闭显示元素。就这样。因此,1 位像素可以直接控制的唯一可能颜色是黑色表示关闭 (0),白色表示开启 (1)。但间接地,一位可以指向内存中其他地方的颜色图的两行之一——第 0 行或第 1 行。假设每个颜色图行有 24 位。这足以控制超过 1600 万种不同颜色的显示可能性。只有两行,因此任何时候只有两种可能的颜色可用,但它们可能像淡紫色和黄绿色一样微妙。由于一级间接以电子速度发生,因此就狡猾的人类而言,它会立即发生。使用颜色图技巧,像素不会控制显示元素。它选择控制显示元素的颜色映射表的行。
一个 8 位像素是一个更典型的例子。一个 8 位像素可以指向颜色映射表中的 256 行之一。同样,让我们假设每个颜色图行都有 24 位。因此,取而代之的是在 256 种可能的颜色(价值 8 位)中直接可用,颜色图技巧使超过 1600 万种颜色(价值 24 位)间接成为可能。在这两种情况下,可以控制的颜色数量保持不变 (256),但在间接情况下,这些颜色的选择数量会大大增加。
在本章中,我们遇到了 6 位像素(64 色)和 8 位像素(256 色),然后我们跃升至 24 位像素(超过 1600 万色)。一个人最多可以识别大约 1600 万种颜色,因此在一般情况下几乎没有理由使用超过 24 位的像素。24 像素位数在千禧年变得普遍,从而实现了大数字融合。所以 24 位像素(我们说的正好是 16兆色)是当今的标准——在数字电影或手机中。
摆脱过去制约的一种方法是通过数字计算机的故障安全功能模拟替代未来。这是人类所知道的最高水平的“艺术”,实际上是在不知不觉中创造一个新世界。. . . 纯粹审美探索的可能性是革命性的,尚未尝试。City-Scape是迈向未来的第一步。
——Gene Youngblood,扩展电影,1970 2
Gene Youngblood 是 1960 年代洛杉矶报纸的影评人和专栏作家。1970 年,也就是数字大融合前的 30 年,他思考了即将到来的变化,并在《扩展电影》中发表了他的想法。它是媒体艺术领域的权威书籍,这是一个将实验电影、视频——甚至是新生的计算机图形学——作为新兴艺术形式推广的新领域。这是对充满活力的六十年代的总结和庆祝——这是反文化革命的明显成就。令人惊讶的是,这本书告诉我们很多关于数码光的历史。
我们在第 2 章中了解到像素这个词在 1965 年首次使用。Youngblood 在Expanded Cinema中只提到过一次“PIXELS” ——就这样,全部大写。仅仅五年后,这对他来说仍然是一个陌生的词。摩尔定律也存在于 1965 年,但尚未引起公众的注意,正如 Youngblood 的观察所证明的那样:
计算机生成运动中的实时逼真图像所需的比特要求远远超出了目前的技术水平。3
Youngblood 并不知道,但他在数码色彩到来的那一刻拍下了珍贵的快照。他没有定义像素,但他的例子让我们专注于定义。他书中的提示引导我找到了第一个有色人种。
如果Expanded Cinema是对的,那么太空竞赛就是彩色像素的孵化器。正如我们在第 6 章中了解到的那样,军事组织 ARPA 资助了预彩色计算机图形学。它的姊妹机构 NASA 大约在同一时间成立,将计算机图形学推向了彩色。
在题为“控制电影和计算机电影”的一章中,Youngblood 讨论了 NASA 与加州帕萨迪纳加州理工学院喷气推进实验室 (JPL) 在水手航天器计划中的合作。从 1962 年到 1973 年,NASA 与 JPL 合作完成了七次成功的火星、金星和水星无人飞行任务。JPL 为该项目建立了一个成像系统。Youngblood 有这样的说法:
这个奇妙的系统将实时电视信号转换为存储在特殊数据光盘上的数字图像元素。图片本身不存储;只有它的数字翻译。4
也就是说,它存储的是离散像素,而不是连续的模拟电视信号。
本部分的题词来自 Youngblood 对City-Scape的讨论,这是一部由 Peter Kamnitzer 拍摄的简化城市景观的彩色电影。Youngblood 在 1970 年还观察到这部电影是在通用电气为 NASA 制造的模拟器上制作的:
它已被用于模拟登月条件已有十多年了。5
NASA 的承包商 GE 和 JPL 早在 1960 年或 1962 年就已经显示彩色像素了吗?请记住,计算机图形学的三驾马车和中心法则——应使用文艺复兴时期的视角在二维中观察三维欧几里得几何——如目前使用的那样,于 1963 年在麻省理工学院首次亮相。如果颜色出现在前面,那将是相当令人惊讶的那个黑白地标。让我们探索一下颜色对 NASA 的意义。
Youngblood 描述了用于以每像素 6 位(64 色)描绘数字彩色图像的 JPL 系统。最终系统是这样工作的:图片被发送到地球并存储在一个磁性旋转磁盘上,然后重新组合成 512 行,每行 480 像素,用于彩色电视显示。但是 JPL 的第一张图像(图 7.2)并没有那么复杂:它只有 200 x 200 像素存储在内存中,而且它的显示是在纸上手绘的!
用于存储像素的数字存储器有一个特殊的词。之所以称为帧缓冲区,是因为它可以缓冲(或存储)一帧(或数字图片)。这只是普通的记忆——除了你可以看到里面有什么。帧缓冲区与显示设备密切相关,显示设备每 30 秒扫描一次帧缓冲区内存,并使用那里的像素来控制例如电视显示器上的颜色。对于第一张太空图片,JPL 使用了机械帧缓冲区——磁性旋转磁盘——由 6 位像素组成,代表 200 行,每行 200 像素。6
图 7.2
水手 4 号在 1965 年 7 月的一次飞行中从火星传回了它的第一个图像数据。航天器通过交替的红色和绿色滤镜向地球传递了 21 张照片。由于这些照片是从一艘移动的航天器上拍摄的,因此没有记录连续的图像。但是在它们确实重叠的地方,可以进行粗略的颜色重建——只有红色和绿色成分,但没有蓝色。工程师们渴望看到火星,他们不想等待计算机处理和显示数据。相反,他们从一家美术用品商店购买彩色蜡笔,并将显示元素手绘到原始像素值的数字打印输出上。这不是电子显示“设备”,因此这不是我们定义的第一幅数字彩色图像。7
仔细检查发现这些不是来自火星的颜色。官方报告中明确指出,“虽然得到的数据大致相当于一张双色照片,但并不是要把两张照片组合成一张彩色照片,很多因素结合在一起,阻碍了数码照片的直接解读。”数据作为任何特定颜色的指示。” 兴奋的工程师所做的是为 6 位像素分配颜色,将较亮的颜色分配给较亮的像素,将较暗的颜色分配给较暗的像素。由此产生的颜色表明火星的颜色是他们选择粉彩棒的意外。那些工程师还不知道火星的实际颜色。8
Mariner 工程师使用的技术类似于将颜色间接存储在像素中的颜色图方式。他们设置了一个颜色键或图例,将棕色分配给 45 到 50 的像素值,将黄色分配给 20 到 25 的像素值,依此类推。他们只使用了六种不同的颜色,而不是技术允许的 64 种颜色(因为 6 位可以存储那么多)。另一种说法是,他们的颜色表将所有 64 个像素值编码为六种颜色。例如,表的第 45 行到第 50 行,对应于从 45 到 50 的像素值,都存储了相同的颜色,棕色。9
彩色映射图像有时称为伪彩色或假彩色图像。颜色是任意分配给像素值的,没有特定的顺序——与 Mariner 工程师所做的没有什么不同。不要求颜色图中的颜色代表现实。早期的计算机艺术家如此频繁地使用伪色——光谱颜色按彩虹顺序排列——以至于它很快变得像扎染的 T 恤一样陈旧。
尽管这是太空计划中的一项重大成就——一张来自火星的彩色照片!——但有两件事让我不能称它为第一个彩色数码灯。首先,正如我们在早期的计算机和电影史中看到的那样,机械磁盘是事件“首次”的一个瑕疵;我们真的在寻找第一个完全电子化的彩色像素实现——使用完全电子化的帧缓冲区。其次,显示元素的手工实现将其置于 Digital Light 之外。但 Mariner 系统是 Digital Light 中引人注目的“几乎首创”。
如果 JPL 没有第一个彩色像素,那么来自 Youngblood 的Expanded Cinema的另一个建议是通用电气呢?
1964 年 8 月的一份通用电气“最终报告”描述了我认为最早使用计算颜色的方法。为休斯顿的 NASA 载人航天器中心建造的 GE 飞行模拟器的模型仅包含一个无限的地平面,该地平面被覆盖或纹理化,并带有重复的颜色瓷砖。图 7.3 是该模拟器的早期彩色图片,通常称为 NASA-1。它相当粗略地代表了飞行员通过航天器窗口看到的月球表面——红色区域是着陆区,不同的纹理代表陨石坑。10
您可以将每个图块视为由较小图块或子图块组成的小光栅有序数组。所以瓦片是一个正方形,由 8 x 8 数组中的 64 个正方形子瓦片组成。这些不是像素!它们实际上是小的几何正方形。NASA-1 计算了一个平铺平面的透视图,一次一个显示元素穿过彩色电视显示器的每个扫描线。它做到这一点非常快,实时。这就是它在 1964 年花费数百万美元的原因。对于每条扫描线上的每个显示元素,NASA-1 计算出飞行员在该点看到纹理平面时会看到哪个图块,以及哪个子图块。这是一个几何计算,使用透视几何。然后它简单地查找那个子图块的颜色并将其发送到彩色显示器。11
图 7.3
这听起来很像对连续的视觉场景进行采样,然后在显示时从样本中重建场景。但这些样本是模拟的。在这个模拟器中,没有以数字方式存储颜色。每种颜色都是通过旋转电位器来设置的,比如老式收音机上的音量旋钮或天花板灯上的旋转调光器开关。所以 NASA-1 采集了颜色样本,但没有将它们转换为彩色像素。它们不是最早的彩色像素。
这种 NASA-1 着色技术的另一个“几乎首创”是在计算机图形学中使用了一种称为纹理映射的技术。存储在数组中的颜色为原本毫无特色的广阔空间提供了良好的结构。然而,我不称这是纹理映射的第一次使用,因为它不是完全数字化的。首先是等待一个名叫 Ed Catmull 的年轻人的到来,他于 1974 年在犹他大学的一篇非凡的博士论文中首次描述了它。我们将在本章后面听到更多关于他和那篇论文的信息。
罗伯特·舒马克(“Shoo mahk er”)是 1960 年代初在纽约州北部通用电气公司 NASA-1 的一名工程师。在从他位于盐湖城的家中发送的一封电子邮件中,他分享了一张自己当时工作的照片,留着平顶发型和一根烟斗。他详细解释了我刚才描述的模拟器图像是如何生成的,尽管那些早期计算机的内存非常有限。最重要的是,他揭示了样本和像素之间的细微差别。12
但后来他告诉我这个项目最奇怪的方面。模拟航天器的滚动——如偏航、俯仰和滚动——必须向飞行员展示。普通电视中的扫描线始终是水平的。但在 NASA-1 中,他们使用阴极射线管的电磁偏转器实时旋转整个电视显示器。舒马克本人已经实施了这种独特的模拟技术。这是一项令人瞠目结舌的工程壮举。但在 1964 年之前的摩尔定律中,即使预算为 100 万美元,它仍然比计算滚动更便宜。13
Youngblood 在他的书的历史快照中再次暗示了第一个颜色像素。他描述了令人印象深刻的惠特尼家族(加利福尼亚的一个艺术王朝)的美丽集体作品,约翰和詹姆斯兄弟,以及约翰的三个儿子小约翰、迈克尔和马克。惠特尼有第一个彩色像素吗?14
老约翰·惠特尼 (John Whitney Sr.) 令人惊叹的早期“计算机艺术”不是 Digital Light 的一部分,因为它是用模拟设备制作的。他早期的电影作品真的很美,给了我个人灵感,但它们不是数字的。根本没有像素,也没有数字计算机。但在 1968 年,当老约翰创作了一部名为Permutations的电影时,情况发生了变化。它使用了一台数字计算机,但它的图形是书法的,而不是像素的。Permutations中的颜色是事后使用滤色器添加的。这不是计算的。排列很可爱,但不是我们想要的。15
他的兄弟詹姆斯惠特尼也创造了美丽的作品,但没有像素。所以我们转向年轻一代。其中两个,小约翰和迈克尔,确实制作了数字计算机艺术电影。迈克尔是第一个使用像素的惠特尼,他的二进制位模式(1969 年)。但他也在光学上添加了颜色——仍然没有颜色像素。稍后,正如我们将看到的,摩尔定律将特别是小约翰推向彩色像素。16
我们已经看到 Gene Youngblood 在他的关于 Peter Kamnitzer 的City-Scape的书中写道(如果不是狂赞的话) 。Kamnitzer 是加州大学洛杉矶分校的建筑学教授,他想要一个用于城市规划的图形系统,而不是艺术。为艺术而拍照肯定会被认为是对稀有物品的轻率使用当天的系统,提醒我们在婴儿初生之光的早期也有类似的看法。
无论 Kamnitzer 的论点是什么,他都成功获得了通用电气为 NASA 位于休斯顿的载人航天中心建造的价值 200 万美元(今天为 1500 万美元)的模拟器。1968 年,他用它创建了City-Scape,这是一个简化的城市景观的实时驾车穿越。模拟是彩色的,但是颜色太原始了,以至于 Youngblood 没有费心在Expanded Cinema中使用它。事实上,图 7.4 来自 Youngblood 的书。
图 7.4
相反,Youngblood 在提到City-Scape时惊叹于“在计算机生成之前不存在代表性图像”。换句话说,NASA 系统是从零开始制作像素的。Youngblood 对此的惊讶让我们今天感到惊讶。17
但让我感兴趣的是这些像素是彩色像素。1968 年,Youngblood 将该系统称为 NASA-2。但它到底是什么,它是什么时候第一次产生颜色的?城市景观讨论是最终刷新我的历史猎物的线索。
我们的孩子学会了新的技巧,在成熟到成年作为人类进步的工具方面又迈出了一步。当有声电影第一次出现时,人们说世界永远不会一样。半色调 [阴影] 图形已经到来,计算机世界已经永远改变。
——W。杰克·布克奈特,1969 18
NASA-2 是 NASA-1 的儿子。它也是在通用电气为 NASA 航天器模拟——阿波罗月球计划而建造的。相同的工程师创建了这两个系统。以下是 NASA-2 的一些重要的第一次,所有这些都发生在纽约州北部的通用电气公司。它显示:
当我开始了解 NASA-2 拥有第一个彩色像素时,我发现我们在讨论 NASA-1 时遇到的两位关键工程师 Rodney Rougelot(“Roozsh low”)和 Robert Schumacker 都已退休到盐湖城。
2018年,我提议去见他们两个。Rougelot 亲切地邀请我到他在犹他大学附近的家中参加这次活动。经过几十年的合作,他和舒马克仍然是最好的朋友。所以他们都在那里,我们聊了七个小时。
罗德·鲁格洛 (Rod Rougelot) 是一个爱开玩笑、口齿伶俐的大人物。我没有注意到他是两个人中的矮个,直到他笑着指出了这一点。然后他告诉我一个特别有意义的相遇:
1951 年,Rougelot 在开课前四天抵达纽约州北部的康奈尔大学。他很早就参加了在童子军营地举行的新生迎新活动,在那里,他与另一位新生唐纳德·格林伯格(Donald Greenberg)共用一个帐篷,后者将成为另一位计算机图形学先驱。正如我们将看到的,他们的生活将继续交织在一起。21
Rougelot 于 1956 年毕业于康奈尔大学,获得电气工程学士学位。1960 年 7 月,他开始在通用电气位于康奈尔家乡伊萨卡的工厂工作。
同年,两个朋友中个子较高的 Bob Schumacker 从麻省理工学院毕业,获得电气工程硕士学位,也加入了 GE Ithaca。当我在盐湖城 Rougelot 的家中见到他时,他已经丢掉了他年轻时的平顶和烟斗。他现在是一名首席飞行员和一名民间舞者。他说话的时候直视你,这不是胡说八道。当我询问技术细节时,我得到了它们,并根据我的技能水平进行了仔细校准。
他们两人——以及经常被提及的其他团队——为阿波罗计划创建了 NASA-1 和 NASA-2 模拟器。他们在伊萨卡以北约 50 英里的 GE 锡拉丘兹建造了 NASA-1 和 NASA-2。对于 NASA-2,该团队使用了刚刚可用的集成电路。到 1967 年初,这个模拟器已经显示了第一个彩色像素,并使用这些像素显示了第一个 3D 渲染对象。它们是摩尔定律的首批成果之一,就本书而言,它们标志着第二纪元的真正开始。22
1972 年,Rougelot 和 Schumacker 加入了盐湖城的 Evans & Sutherland,并在那里创建了一系列令人印象深刻的、日益复杂的飞行模拟器。Ivan Sutherland 在 Skype 对话中告诉我,这些前 GE 工程师对 E&S 随后的成功至关重要。Rougelot 最终成为该公司的首席执行官。23
当图形先驱 Bob Sproull 问我 Rougelot 和 Schumacker 如何制作 NASA-2 项目的原型时,这本书即将完成。他的意思很清楚。第一种颜色可能发生在 1967 年 3 月 31 日之前。Sproull 的直觉是正确的。
舒马克记得,为了让 NASA 相信渲染 3D 物体是可行的,他们展示了“一个实时三角形”的演示。我追求领先并击中了薪水。Rougelot 和 Schumacker 然后更详细地记住了这个演示。它是在“1965 年(可能是 1966 年很早)” NASA-1 交付之后提出的。它显示了一个实心红色三角形,实时渲染,在三个维度上令人信服地旋转和平移。他们使用 NASA-1 的可编程部分作为控制运动的计算机,并使用分立组件(尚未集成电路)构建了一个专用设备来进行渲染。24
Schumacker 回忆说:“三角形演示让我们相信,即使是只有几个多边形,实现任何有用的系统都会非常庞大和昂贵。幸运的是,在我们竞标合同的时候,第一个实用的真正集成电路问世了。. . . 在我们设计时,摩托罗拉仍在从制造过程中消除错误!” 25
这个来自 Epoch 2 爆炸最前沿的几乎被遗忘的演示值得特别提及。保守的年代测定表明,第一个彩色像素是在 1966 年初显示的,但日期不详。1967 年的日期捕获了第一个阴影颜色像素渲染。
Rougelot 和 Schumacker 在 GE 的 NASA-2 上制作了三维阿波罗登月舱的彩色渲染图(返回图 7.1)。他们是如何做到的呢?
我之前已经注意到,一个复杂的 3D 几何模型几乎总是可以用一个只是三角形的模型来代替。模仿第 6 章,我展示了如何只渲染一个三角形,并理解使用计算机放大的荣耀可以类似地渲染数百万个三角形。
这里的三角形被认为是由三个线段界定的平面。在平面几何中,三角形是线段,但在这里重要的是它们之间的平坦三角形表面。
让我们首先看一下这种情况,例如 1967 年的登月舱,其中单个三角形相对于像素间距很大。稍后我们将讨论三角形相对于像素间距较小的情况,这是后千禧年世界的常见情况。图 7.5 显示了这两种情况(仔细查看小三角形)。这些点代表像素位置,即要采集样本的位置。出于我们的目的,假设这些三角形是纯几何。但它们当然不是,它们是对这个页面的显示机制的渲染。让我们假设它们是完美的三角形。
将这些三角形渲染成像素的最坏方法如下:如果像素位置落在三角形内,则其像素为三角形的颜色(蓝色),否则为背景颜色(白色)。图 7.6 显示了结果,蓝色的小圆盘代表蓝色像素。请注意,小三角形被完全遗漏了,而大三角形则布满了“锯齿”。
但这不是蓝色三角形数字图片的显示,小圆盘也不是像素。(具有讽刺意味的是,插图是一张数码照片。)小圆盘的像素并不比小方块多。我可以用小星星。每个代表一个像素,即一个点位置及其附加颜色。黑点(回到图 7.5)是采样点位置;圆盘是在这些位置采集的彩色样本。请注意,所有图 7.6 中的其他磁盘是白色的,所以在这里你看不到它们。所有这些都必须通过显示设备(屏幕或打印机)进行传播,才能将它们变成我们可以看到的数字图片。
图 7.5
图 7.6
虽然这是最糟糕的渲染方式,但它是早期的方式。这是 GE 工程师在 1967 年必须做的事情,以使用第一个彩色像素渲染登月舱。注意图 7.1 中沿 LM 边缘的锯齿。那是幼稚的渲染,很少或没有明确使用采样定理。
接下来我们理想地渲染相同的两个完美三角形,最大限度地利用采样定理。然后我们讨论多年来设计的各种方法来逼近理想的渲染方法。在内存不足和计算能力低下的时代,这些尤其重要。要感受这种不足的深度,请将本节中的 1X到 10X摩尔定律因子与今天(2020 年)的因子(大约 100,000,000,000)进行比较X。那个时候比这差了11个数量级!难以想象——除非你在场。
图 7.7
采样定理非常清楚。以(略大于)最高频率的两倍采样。但是几何三角形有锋利的边缘。回想一下我们在频率峰值中的经验法则,锐利的边缘具有高频率——非常锐利的边缘具有非常高的频率。事实上,我们不能足够频繁地对完美三角形进行采样。它们的边缘包含太高的频率——无限高。像素和显示元件必须间隔太近,在物理上或经济上都不可行。
在计算机图形学中,我们通常朝另一个方向工作。像素间距是给定的——就像在我们的例子中一样——我们必须让采样定理适应它。这意味着我们必须摆脱它的高频的完美三角形——它的锐利边缘。我们必须确保边缘足够圆润,以使边缘从背景上升的速度不会比像素间距快。图 7.7 显示了两个完美的三角形,它们已经模糊到可以被像素正确采样。小三角已经模糊得几乎不存在了。三角形看起来异常模糊。但想象一下实际间距是那个间距的 1/100,更像是手机上显示元素的间距。在这种情况下,模糊不会很明显。我在这里夸大了。
图 7.8 显示了对模糊三角形进行采样得到的像素。同样,我们看不到像素,它们没有形状,所以一个小圆盘只代表一个像素——它的位置和附加的颜色。这次没有错过小三角。
回想一下采样定理告诉我们的内容:当这样表示的像素被显示设备的显示元件扩展和显示时,我们会看到两个模糊的三角形。不是我们模型中完美的几何蓝色三角形。这种锐利的完美是无法用像素来准确表示的。这只是说明采样定理的另一种方式。诀窍在于,在足够高的分辨率下,我们人类对略微模糊的三角形感到满意——因为在正常观看距离下,我们的眼睛看起来并不模糊。
图 7.8
但是我刚刚概述的理想渲染存在问题。从一块硬边几何图形中去除过高的频率意味着什么?什么取代了模型中的三角形?一个三角形应该用一个圆角三角形的计算机描述来代替。或者,如果两个三角形相邻,则必须将连接处修圆并在模型中以某种方式进行描述。这些不是几何概念。实际上,没有人用圆角版本替换计算机图形中的几何模型——去除了过高的频率。那么他们是做什么的呢?他们开发出越来越复杂的对理想场景的近似。事实上,计算机图形学的历史可以被认为是推动更好的近似值来欺骗眼睛。接下来我将讨论其中一个技巧。
如果我们只是在间隔更近的像素位置进行采样呢?说,两倍的频率?想象一下像素的密度是原来的两倍。图 7.9 显示了左侧的旧像素位置,中间是建议的新像素位置,右侧是两者的叠加。事实上,更密集的采样将使令人不快的混叠伪影(例如锯齿)开始出现的频率(水平和垂直)增加一倍。但问题是我们负担不起四倍像素的帧缓冲区。我们能做什么?
这个想法是在每个实际像素位置(大点)周围的四个位置对模型进行采样,如右图所示。以这种方式为每个实际像素位置获得的四个样本称为其子样本或子像素。四种子样本颜色被平均在一起,形成一个实际像素的颜色——存储并发送到显示元素的像素。您可以在图的右侧看到围绕每个实际像素位置的 2 x 2 子样本位置数组。
图 7.9
图 7.10
为了便于说明,我在这里使用了 2 x 2 的子样本数组,但更高的密度也可以。Pixar 使用 4 x 4 的子样本位置数组。图 7.10 显示了两个案例的特写。大点是实际的像素位置,周围的小点是它的子样本位置。在 4 x 4 的情况下,将 16 种子样本颜色平均在一起以形成存储在实际像素中的一种颜色——该颜色最终发送到显示元件以进行扩展和显示。
二次采样技巧有效地提高了最终图像的分辨率,但它并不能完全避免由于采样非常高的频率(例如三角形的边缘)而导致的伪影,因为频率太低而无法满足采样定理。使用 2 x 2 阵列进行二次采样会使离散样本能够充分处理的最高频率翻倍,而 4 x 4 阵列的最高频率则翻了两番。但是在两种情况下都遗漏的尖锐边缘中仍然存在更高的频率。一个令人惊讶的有效的技巧缓解了这个剩余的问题。当摩尔定律提供三个数量级的计算能力时,我们将回到它。
现实只是复杂性的一种方便度量。
——阿尔维·雷·史密斯26
“你的目标是模拟现实吗?” 是我在计算机图形学早期进行的演讲中一直存在的问题。“不!” 我会回答这个问题,因为我们想创造艺术,而不是模拟现实。我终于在上面的题词中精心设计了反驳,这在当时似乎让提问者和我都满意。我试图说明的一点是,如果动画的世界足够丰富——比如说,接近现实——那么观众就会对它感到满意,并会关注角色。现实不是我们想要的。是人物和他们虚构的世界——或者是所有那些“外面”的图片,完全没有与我们所知道的人物或世界绑定。
然而,模拟现实一直是计算机图形学家的心头好。带路的美国宇航局工程师想向阿波罗宇航员展示月球和登月舱的现实。Digital Light 的计算机辅助设计分支旨在为现实世界展示它们实际出现的物体。
但现实似乎与第一部数字电影的奇幻内容——以及在它们之前电影中的早期视觉效果——存在明显的矛盾。它通过将中心法则扩展到欧几里得几何和文艺复兴视角之外来解决。此后,我们将牛顿物理学纳入中心法则——尤其是光学、运动和重力物理学。计算机当然不受中心法则的约束,无论是否扩展,Digital Light 也不受约束。
将中心法则视为计算机图形学的“交响乐”形式。虽受形式束缚,但创意无限。以中心教条形式打造的奇幻世界尊重现实世界的物理、几何和透视。《玩具总动员》的伍迪和巴斯光年在地球引力中行走,灯光和颜色与他们在现实世界中的工作方式一样。或者至少他们看起来如此。
奇怪的是,以前没有人阐明过中心教条。那可能是因为它太明显了。它当然适用于 CAD 人员,我们已经看到面向图片的计算机图形学和 CAD 有着共同的起源。此外,现代视觉效果工作需要遵守中心法则,以将计算机图形与真人镜头无缝集成。这提醒我们拉里·罗伯茨Triumvirate 中心法则的创始人,为了将 3D 计算机图形线条与现实世界棱镜的照片无缝集成,提出了他的解决方案。
动画师挤压和拉伸形式,但他们工作的世界是默认的中心法则的“正常”。各地的计算机图形学家都致力于——而且仍然如此——模拟现实,一次只用一种技术。
但他们都只是黑客。实际上,模拟肥皂、气泡、空气、水等的物理特性非常昂贵,而且在他的有生之年永远也无法实现。. . . 这不仅不是挫折的根源,反而让他感到安慰,让他感到高兴——甚至可能有点沾沾自喜——他生活在一个复杂性与算法模拟相悖的宇宙中。
——尼尔·斯蒂芬森,秋季;或者,躲避地狱,2019 27
串行数字计算机无法通过为具有有限分辨率的显示器创建图片来实现现实。模拟现实是我们所能追求的。现实是模拟的——至少在我们感兴趣的分辨率上,比现实世界在夸克和量子水平上的精细粒度要粗几个数量级。现实并行运作。来自太阳和其他光源的光线同时在任何地方撞击我们的现实世界。尽管我的题词很圆滑——现实只是复杂性的一种方便度量——现实世界的分辨率非常高。
这本书不是计算机图形学教科书,所以我不会描述计算机图形学家为模拟现实而设计的每一种技术。相反,我将概述一些早期的突破以及如何超越它们进行思考。值得一提的是,这些技术广泛应用于 Digital Light 的其他几个方面,例如视频游戏、CAD、飞行模拟器以及虚拟和增强现实。它们不仅限于数字电影这一分支,它构成了我展示所有数字光的骨架。
为了支持这个更大的愿景,我在本章和下一章中的目标涉及第一部数字电影——电影——代表了伟大的数字融合。我强调用于制作第一部电影的技术。但这不是唯一可能的途径。当我们第一次在 NYIT 构思 The Movie 时,我们很乐意通过一个插值中间程序在两个维度上制作它——在中心法则之外。毕竟,多年来,世界对迪士尼的灰姑娘和白雪公主这样的人感到满意。故事和人物引领了这一天——我们并没有忘记这一信息。
但就像摩尔定律驱动的一切一样,随着计算机图形学社区掌握了每次硬件进步所带来的额外功能,电影的最终 3D 中心法则形式逐渐出现。这或许可以解释为什么迪士尼花了这么长时间才全心全意地采用这种新形式。迪士尼一直等到票房要求提供表格,而不仅仅是电影制作人想要的。
我已经讨论过渲染,所以现在让我们转向着色,这是本章标题所建议的另一种技术。着色具有选择每个渲染像素的最终颜色的一般含义。上面示例中三角形的阴影很简单:每个像素都是蓝色(或白色)。阴影这个词随着章节的展开而具有更宏大的含义,摩尔定律提供了更多的动力。(太糟糕了,“Moorespower”并没有轻而易举地从舌头上跳下来。)在彩色像素的早期,对表面进行着色具有传统的中心法则的含义 - 直接增加或减少整个表面的颜色亮度,同时保持其色调常数。在这种情况下,变亮意味着增加亮度,变暗意味着降低亮度。
图 7.1 中的阿波罗登月舱渲染说明了这种简单的阴影。单个光源放置在方便的位置,例如该图的观察者的右上方和后面。随着三角形更充分地面对光源,它会变亮。随着它越来越远离它,它变得越来越暗。这被称为平面着色,并且与早期摩尔定律所能适应的一样简单:每个三角形都以一种颜色呈现。
对于平面阴影,请考虑在每个三角形的中心升起的旗杆,如图 7.11(左)所示。旗杆顶端朝上,方向垂直于三角形。“向上”与光源之间的角度对计算至关重要。如果三角形面向光源——即角度为零度——那么它的色度就尽可能亮。随着角度的增加,阴影变暗(中)。当三角形与光源成直角时,表面阴影尽可能暗。除此之外,三角形背对光源并且不被照亮(右)。由于此着色计算使用三角法(希腊语表示三角形测量),因此我不会详细介绍。可以说,平面着色的三角计算与几何计算一样精确和明确。计算机可以被告知如何执行一次,然后 Amplification 将它们重复数百万或数十亿次,而无需进一步的人工操作。
图 7.11
在本章中,我开始将前几章中的几个线程或流程编织在一起,以提供 Digital Light 的下一阶段——专门用于计算机动画电影的部分。图 7.12 中的流程图旨在捕获这些线程并将它们绑成新的股线。
这张图表的注意事项很熟悉:没有简单的叙述,也没有一个人。为了使大量的名字易于管理,许多人被省略了——在本章和下一章中尤其痛苦——但他们经常在注释中描述。这只是一个草图,而不是完整的学术历史,甚至是专门用于数字电影的计算机图形的受限子集。最后,本章和下一章的散文是对该图的扩展说明。
我添加了源自 NASA 和通用电气的新链,这导致了第一个彩色像素。它还让位于盐湖城的 Evans & Sutherland 公司走上了一条与前一章面向 ARPA 的方法不同的 E&S 途径。然后,其中三股——犹他大学、E&S 和施乐 PARC——编织在一起,流入纽约理工学院,卢卡斯影业和皮克斯都是从那里衍生出来的。另一条支流从新的(到本章的)通用电气分支流入康奈尔大学,然后从那里流入卢卡斯影业,然后是皮克斯。
为了帮助解决太多的名字,我在这个流程图中引入了一个新设备:一个包围一群人的矩形,通过一些单一的特征将他们联合成一个“集团”。例如,最大的矩形包含 8 个人,他们可以说是由犹他大学捐赠给 NYIT 的。如果箭头触及封闭矩形,则它适用于其中的所有人员。如果它只涉及一个封闭的人,那么它只适用于那个人。例如,犹他州集团的所有八人都在纽约理工大学,但只有吉姆·布林是伯特伦·赫尔佐格(Bertram Herzog)的学生,他是第 6 章中提到的先驱。左下集团的所有五人都是卢卡斯影业计算机图形学非常重要的早期成员(而不是纽约理工学院),但只有罗布·库克是唐·格林伯格在康奈尔大学的学生。等等。
从前一章重新加入的前两个线程或流是来自 Bob Taylor 和 Herb Freeman 的那些。然后我选择了前一章中的 Ivan Sutherland 和 Dave Evans 主题,本章中新的 Rod Rougelot 和 Bob Schumacker 主题,以及新的 Don Greenberg 主题。我将所有这些结合在一起,形成了纽约理工学院,然后在下一章,去了卢卡斯影业,然后是皮克斯。
DreamWorks Animation 和 Blue Sky Studios 也采用了类似的思路。数字电影的历史上还有很多公司,但这三家具有代表性。他们是千禧年最早在电脑上制作长篇电影的前三人:皮克斯的《玩具总动员》(1995)、梦工厂的《安兹》 (1998)和蓝天的《冰河世纪》(2002)。由于篇幅原因和我个人的专业知识,我主要关注皮克斯的线程。
现在,在下一个小节中,让我们朝着这些成就迈出另一个巨大的摩尔定律数量级。
X(1970–1975)Rod Rougelot 和 Bob Schumacker 在位于伊萨卡的通用电气工厂开发了 NASA-1,该工厂也是康奈尔大学的所在地。他们在北约 50 英里的锡拉丘兹的 GE 开发了 NASA-2——具有第一个彩色像素和第一个实时彩色 3D 渲染。他们在 GE Syracuse 的最后一项成就是 1968 年的非实时(缩写为“non-RT”)系统,旨在进一步开发不受实时限制的三维计算机图形。28
1968 年,Don Greenberg 在康奈尔大学攻读建筑学博士学位,同年,Rougelot 和 SchumackerSyracuse 的非 RT 系统在线。就上下文而言,萨瑟兰的头戴式显示器大约在同一时间在哈佛开发。
图 7.12
在“你认识谁”的关键时刻之一,鲁格洛特让格林伯格——他在新生童子军帐篷日时的康奈尔老朋友——访问了新的通用电气系统,即非 RT 系统。然而,有一个问题。格林伯格只能在晚上使用它,名义上是从下午 5 点到早上 8 点,每周三个晚上。它在锡拉丘兹,离伊萨卡大约一个小时的路程。
几个月来,格林伯格在每一个空闲的日子里,都会开车把他的一群学生从伊萨卡带到锡拉丘兹上夜班。1972 年的“康奈尔电影”由此诞生,这是一部 15 分钟的计算机动画之旅,穿越康奈尔大学校园,展示了一座拟议中的新建筑将如何融入其中。电影中的彩色图像发表在格林伯格关于计算机图形学的文章中1974 年 5 月的美国人,并在其封面上。29
唐·格林伯格是计算机图形学中笑容最灿烂、最热情的人,他的特点是关心他的学生和关心他自己。他指导他的年轻团队在计算机图形学方面取得成功。也许他是一名运动员并不奇怪——而且在他 80 多岁时仍然是网球冠军。从第一部电影开始,他建立了康奈尔著名的计算机图形系,该系与犹他大学的影响力一样大。
Rougelot 和 Schumacker 在 1967 年就已经有了实时 3D 渲染图形。但他们的系统依赖于 NASA 的无底资源,并且使用了专用硬件。我区分了实时动画和电影动画,每帧的计算都需要尽可能长的时间。康奈尔大学的电影属于大学里的个人可以在通用计算机上完成的范围之内。它是第一个 3D 渲染的计算机动画吗?
该荣誉的知名竞争者是 1971 年由犹他大学研究生 Ed Catmull 报道的一张脸变成蝙蝠的一秒钟动画。或者是 Ed 的同学 Fred Parke 在 1971 年制作的动画面孔。或者据说 Ed 在 1972 年 1 月计算并在 1972 年 8 月演示的动画手(图 7.13,左)。或者是 Ed 的同学 Fred Parke 在 1972 年创作的动画人脸(图 7.13,中间)。或者唐·格林伯格的学生马克·莱沃伊所说的康奈尔大学电影于 1972 年中秋完成(图 7.13,右)。其中,只有康奈尔的电影是彩色的。Ed 于 1971 年末或 1972 年 1 月初完成的面对面着色图形动画,显然是同时为同一班级制作的 Fred 的动画脸,是这次特殊比赛的获胜者。让我们称之为领带。但1972 年这一年再次出现了显着的技术融合,就像电影的 1895 年一样。30
图 7.13
最有趣的模型包含大量三角形——通常是数百万个。考虑第 6 章中的线框茶壶,它有数百个三角形。或者康奈尔电影中康奈尔校区的建筑。从选定的角度看,这些三角形经常相互重叠。如果它们充满纯色,那么它们往往会相互隐藏。也许早期研究最多的计算机图形学问题被称为可见表面问题或隐藏表面问题,它相当于同一件事:在场景中的所有三角形中,哪些三角形对虚拟相机可见中央教条?
几何学的真正概念是,在我们可以计算的意义上,我们确切地知道三角形的每个点的位置——在它的表面上的任何地方。我们确切地知道虚拟相机的视点在哪里以及它的外观。
特别是,可以计算从视点到三角形上任意点的距离。我们称该距离为点的深度。因此,离观察者的眼睛更远的点——离虚拟相机——更深入到场景中。我们可以计算三角形上像素位置的点的深度。这就是几何数学的全部意义所在。我不是要你理解如何进行这样的计算。我只要求你明白,当计算机被指示做一次这样的计算时,它可以一次又一次地无限次地做,而不再需要人类。
只考虑两个三角形,一个蓝色的和一个红色的,如图 7.14 所示。一种在另一个之前渲染一个的简单方法,即使它们相交,如下所示:
图 7.14
顺便说一句,深度缓冲是 Ed Catmull 1974 年著名的博士论文的主要贡献。Ed 实际上在深度缓冲方面位居第二,Wolfgang Strasser 在他1974 年的博士论文中几乎没有抢到。但是施特拉瑟的论文是德文的,所以他们彼此并不了解。31
深度缓冲很容易描述,但它有一个问题:你必须渲染所有的三角形,甚至是那些完全隐藏的三角形。可见表面的一些方法解决方案建议按深度顺序对三角形进行排序,然后仅渲染可见或部分可见的三角形。这通常可以节省很多渲染时间。
图 7.15
但是相交的三角形不能按深度顺序排列。一个三角形的一部分比另一个三角形更深,而它的另一部分则更浅。但是您总是可以将相交的三角形细分为不相交的较小三角形,如图 7.15 所示。
无论您将深度缓冲用于可见表面解决方案还是深度排序的(不相交的)三角形,放大的魔力都可以重复数百万个三角形的计算。不应将大量计算与难度相混淆,尤其是当它们中的每一个都像深度缓冲一样容易理解时。
中心法则规定数字对象会像现实世界的对象一样投射阴影。计算机图形模型最初只包含对象描述和虚拟相机的位置。但是模型的概念很快扩展到包括光源,例如灯。在早期,光源非常简单。它在一个点上有一个位置,并向各个方向发射白光。这是一个点光源。随着摩尔定律力量的增长,光源变得更加精美,并且更仔细地模拟了真实世界的光源。它们有范围——也就是说,它们占据了一个区域,而不仅仅是一个点——并且有颜色,以及真正的灯、光和太阳的其他属性。
图 7.16
确定阴影本质上与隐藏表面问题相同。如果您只考虑一个简单的点光源,这一点尤其明显。想象一下,虚拟摄像机从光源位置查看场景。从这个视点看不到的任何表面都必须在阴影中。
因此,计算阴影是一个定义明确但乏味的计算。只要说我们知道所有物体的几何形状以及光源的几何位置就足够了。因此,计算哪些表面处于阴影中很简单。然后我们可以在以后使用这个事实来确定当我们从所需的视点看到它时最终应该将什么颜色渲染到显示器上,这将与光源本身不同。摩尔定律的改进后来允许具有范围和颜色的多个光源。而且,像往常一样,放大意味着程序员只需要设计一种算法。我们的计算机会忠实地重新执行它数百万次。32
到目前为止,我们看到渲染的三角形具有简单的纯色——最简单的着色模型——如果它们处于阴影中或远离光源,它们可能会变暗。早期的计算机图形学家很快学会了如何以更奇特的方式进行渲染,因为摩尔定律赋予了他们更多的力量。例如,随着与虚拟相机的距离(深度)增加,或者与已知光源的接近度减少(图 7.16,左),颜色可以被着色。三角形可能是部分透明的(左起第二个)。三角形可以用另一张图片的像素进行纹理处理,比如草或牛仔布(第三张)。这本质上是我在之前对 NASA-1 模拟器的讨论中简要解释的纹理映射技术。或者可以使用这些技术的组合(图 7.16,右)。这些只是无穷无尽的几个例子。
纹理映射是基于一个从根本上强大的想法。这是基于像素的数字光与基于几何的数字光结合的一个典型例子。强大的想法是一个数字图像可以控制另一个图像的外观。纹理映射是基于这个想法的几种技术中的第一种。
图 7.17
我们已经看到 Rod Rougelot 和 Bob Schumacker 在阿波罗计划的 NASA-1 模拟器中提出了这个想法的模拟版本。当通过几何三角形的扫描线在电视显示器上被渲染成颜色时,颜色是从访问彩色几何子图块的光栅阵列的几何计算中获得的。一旦计算出适当的子图块,它的(模拟)颜色就会发送到显示器。
由 Ed Catmull 在 1974 年的博士论文中介绍的数字等价物,用像素的光栅阵列代替了几何子块的光栅阵列——也就是说,它用数字化样本代替了几何。
在图 7.17 中,一个三角形显示在左上角。存储在计算机内部模型中的三角形没有颜色。相反,它的颜色间接存储在右侧表示的纹理图中——来自黄玫瑰的数码照片。
三角形实际上是不可见的。它以数学方式存储在计算机模型中,作为几何上完美的欧几里得三角形。你看不到它。您看到的三角形是将抽象三角形渲染到此页面的显示中。
同样,纹理贴图是像素数组,您看不到它们。玫瑰是纹理贴图的显示,而不是纹理贴图本身。这提醒了本书的主要观点之一:像素的显示与像素本身是分开的。要查看像素,它们必须由所选显示介质的显示元素(在本例中为打印页面)散布。下面的解释要求您不要将尖尖的像素与其平滑显示混为一谈。
所以玫瑰是用来控制另一个颜色的采样图片。您可以将纹理映射视为将贴花应用于三角形。或者将三角形想象成饼干切割器,将纹理图想象成面团。以您希望的任何角度贴上贴花或切出饼干,例如此处使用的 10 o。但是贴花和饼干面团是光滑连续的东西。为了理解这些隐喻,您必须记住,纹理贴图总是可以通过扩展和添加采样定理所教导的像素来重建为平滑的连续图片。
这个想法是将三角形逐个扫描线渲染为显示设备的像素。在图中,中间的三角形表示过程中游。上面的扫描线已经被渲染。这些点(粗略地)表示沿着当前扫描线的像素位置,接下来要渲染。那里的像素颜色取自玫瑰纹理贴图。玫瑰上的圆点表示要对颜色进行采样的位置。简单的几何计算计算纹理中与要显示的像素位置相对应的点。在玫瑰上如此计算的点线倾斜 10度,以考虑贴花或饼干切割器的旋转。
但是有一个问题。纹理贴图是像素。就计算机而言,这是一个尖尖的钉床。您在纹理贴图中采样的点,基于几何,几乎可以肯定不对应于纹理贴图的像素之一。一般来说,直接的几何计算会产生一个位于纹理图像素位置之间的点。早期,从业者使用纹理图中距离计算点最近的像素的颜色,将一个像素渲染到显示器上。这是一个很差的近似值,但当时没有足够的能力进行更高级的计算。下一个想法是找到离计算点最近的四个像素,并将它们的颜色平均为最终显示颜色。
但是有一种正确的方法来进行纹理映射,这是采样定理的直接结果:在纹理映射中扩展和添加像素以获得连续光滑的表面——贴花或饼干面团——正是从无到有引入的东西的魔力在科捷利尼科夫一章中。那么计算的点必须落在这个重建的光滑表面上的某个地方。重建表面上那个确切点的颜色是要发送到显示设备的颜色。已经设计了许多年的技巧来避免进行这种完整的计算,但它是随时待命。所缺少的只是一个足够高的摩尔定律因子。
纹理映射的更大理念值得重复:一张图像可以用来控制另一张图像。纹理映射使用控制图像来确定其他图像的颜色。在一般意义上,纹理映射是一种流行的着色形式,着色提供渲染像素的颜色。但是还有另一个含义,颜色的阴影取决于物理牛顿光学的模拟。
计算机图形学家很快发现,随着摩尔定律力量的增强,如何颠覆几何真相以获得更令人愉悦的阴影。1971 年在犹他大学的法国人 Henri Gouraud 有一个聪明的想法,即在三角形的每个角上放置一个不同的“向上”。他没有在三角形的中心放置一根旗杆,而是在每个角落放置了旗杆——然后将它们向不同的方向倾斜。他计算了每个角落的颜色,根据前面解释的那个角落的“向上”进行着色。然后在这些角落阴影之间插入三角形上每个点的阴影。Gouraud 使用的这种插值是所谓的线性插值:如果一个角的阴影是 A,另一个角的阴影是 B,那么两个角中间的点就有 A 和 B 中间的阴影。图 7。33
图 7.18
图 7.19
但是Gouraud 阴影有些地方不太对劲。正如我们在现实世界中的实际物体上经常看到的那样,没有适当的亮点,至少没有令人信服的亮点。1973 年,一名越南学生 Bui Tuong Phong 来到犹他州解决这个问题。他指出,Gouraud 阴影假定了一种不自然的光源,其强度随着远离它而呈线性或成比例地变化。没有光源实际上是这样工作的。没有一个是线性的。Phong 在他的光源模型中添加了一个真实的非线性(图 7.19,右)。这意味着当向上接近光源时,其三角形的颜色会显着快速变亮。您会在该附近获得更逼真的亮点。34
Phong 还使用了一种更复杂的方法来计算阴影,这需要更多的马力,但效果更好。像 Gouraud 一样,他在每个角落都放置了旗杆,然后将它们倾斜到不同的方向。在它们之间插入了一个平滑的 ups 表面,从而在三角形的任何点上定义了“up”。Phong 使用的插值类型也是线性插值:如果一个角的上倾斜角度 A,而另一个角的上倾斜角度 B,则两个角中间的点在 A 和B. 一般来说,它几乎总是不是一个旗杆在中心的方向。
回想一下第 6 章对样条线和补丁的讨论,插值只是“颠倒”的采样。因此,Phong 着色本质上是采样数学与几何数学的另一种结合。将其视为定义其光学形状的表面,而无需实际更改模型的几何形状。可以说,它是一个起伏的表面,漂浮在底层几何模型之上——这是一个巧妙的技巧,可以在没有真正去除平面的情况下去除平面,如图 7.19 所示(右图,忽略轮廓)。这是一种新型好莱坞的另一种假面技术。
这个技巧可以概括。Phong 在拐角处使用简单的比例或线性插值。通过使用分布在曲面上的更多 ups,您可以进行双三次插值,以创建一个平滑的起伏曲面,例如 Bézier 补丁。我将展示如何在下一个数量级上将这个想法发挥到极致。
Phong 将光照模型的概念添加到计算机图形建模中。换句话说,阴影也具有照明的附加意义。阴影概念开始推广到更复杂的物理光学模拟。
与此同时,Digital Light 的另一个分支正在加利福尼亚州推进,靠近斯坦福大学,该地区很快就会被称为硅谷。它也是关于彩色像素的,但它在中心法则之外。
Richard “Dick” Shoup 于 1943 年出生在匹兹堡,在吉布森尼亚以北几英里的地方长大,一头红发,脸上满是雀斑。他是一个拥有 50 英亩肘部空间的农场孩子,后来成为一名出色的爵士长号手和电子高手。在 1950 年代后期,迪克的叔叔给了他一些关于无线电和电子的小册子,这些小册子是科幻杂志《神奇故事》的创作者雨果·格恩斯巴克 (Hugo Gernsback) 写的,这些小册子启发了他未来的职业生涯。35
迪克于 1970 年在戈登·贝尔(Gordon Bell)手下的卡内基梅隆大学(Carnegie Mellon University)获得博士学位,后者后来成为 Digital Equipment Corporation 的首席架构师。贝尔在那里帮助设计了 PDP-1,这是Spacewar出名的计算机。迪克的论文是关于可编程计算机逻辑的,该方案采用逻辑“单元”的许多副本,可以对其功能和与相邻单元的连接进行编程。我们成为了好朋友,因为我 1969 年的博士论文是关于元胞自动机的。我的主题大致相当于他的硬件研究的数学等价物。
完成那篇论文的第二天,迪克向西去了加利福尼亚,加入了伯克利计算机公司,打算建造一台大型分时机器。但是时机不对。就在那时,分时度假市场跌入谷底,让他和他的高级同事担心到 1970 年 11 月的薪水。幸运的是,鲍勃·泰勒刚刚从伯克利进入旧金山湾对面的施乐帕洛阿尔托研究中心 (PARC)。他迅速找到了这家倒闭公司的几个关键人物,包括迪克舒普。
迪克对 PARC 的主要贡献是他的彩色视频系统。他设计并建造了它的硬件并编写了它的第一个软件,包括SuperPaint。该系统具有每像素 8 位(256 色)和一个完全数字的帧缓冲区。迪克并不是第一个使用彩色像素的人——六年前的 NASA-2 图片证明了这一点——但他的系统认真而充分地利用了它们。他的像素可供任何人使用,像我一样,会编程或绘画。可以这么说,它们是通用的彩色像素。
正如我们在第 6 章中了解到的那样,阿尔伯特·爱因斯坦在 1938 年写信从纳粹手中拯救孩子赫伯·弗里曼。三十年后,当时是计算机图形学的先驱,弗里曼聘请我刚从斯坦福研究生院毕业,担任新的助理教授。约克大学,他在那里担任系主任。我是一名计算机科学家,爱好绘画,用油和丙烯酸树脂,所以我一定看起来很适合计算机图形学。他很快就敦促我从高塔跳到臭气熏天——放弃我的博士工作,即计算机科学的定理证明部分,转而从事图片制作。但我的回答是,“当你得到颜色时,赫伯,我会做的。” 事实上,我不得不被猛地从我的脚上拉下来并停止寒冷才能做出改变。
1972 年末,当我在冰冷的新罕布什尔州滑雪场上滑雪时,警钟敲响了。我的长袜帽滑落,让我失明。另一位完全失控的滑雪者在碰撞路线上向我冲过来。我全速穿过他。我可能已经刺穿或去脑了他,但绊脚石却毫发无伤地溜走了。我没有。我的右股骨严重的螺旋形骨折使我在全身石膏中躺了三个月,从乳头到脚趾——一个完全依赖他人的无助、不动的病人。
但我在那张石膏婴儿床上并不痛苦。离得很远。这是一个广阔的精神游乐场。似乎当你把你的大脑从移动你的身体的苦差事中解脱出来时,它就可以自由地做其他事情了。为了消磨那些时间,我想了又想。终于清楚地意识到我的生活和那个绊脚石一样偏离了轨道。
出事了。在学术上我进展顺利,但我没有为我的艺术做任何事情。无奈之下,我做出了决定。当我从演员阵容中脱颖而出时,我会辞去教授的职务并返回加利福尼亚,那里“会有好事发生”。现在回想起来,这是一个令人惊叹的无内容计划。但我还是执行了它——好事确实发生了。在那里,我与我的蜂窝逻辑朋友 Dick Shoup 重新建立了联系。在他的催促下,我于 1974 年加入了他在全盛时期的施乐 PARC,并找到了彩色像素和绘画程序。艺术和计算机。36
迪克很清楚他不是第一个拥有彩色像素的人,但他不知道是谁。事实上,我们已经看到,Rougelot 和 Schumacker 及其团队比迪克早 6 年,也就是 1967 年获得了第一个彩色像素。他们的 6 位像素(64 色)在NASA-2 航天器模拟器。我在注释中列出了 1968 年和 1969 年每像素 2 位和 3 位的几个系统,包括贝尔实验室的琼·米勒 (Joan Miller) 的第一个 3 位像素(8 色)的绘画程序。所有这些发展,除了米勒的,都使用机械磁盘作为记忆,她的系统使用模拟色彩控制,所以它不是全数字的。37
迪克也不愿声称他是第一个使用 8 位像素(256 色)的人。谁知道,他会问,那些秘密政府机构在 1960 年代和 1970 年代都在做什么?我听说过 1973 年在 PARC 早于迪克的 8 位像素(256 色)的轶事,但没有找到任何文件证据。38
尽管如此,SuperPaint 在几个方面表现出色:它有一个颜色映射,将 256 个像素值中的每一个映射到 1600 万种颜色中的一种——即 8 位输入,24 位输出。它是符合美国 NTSC 标准的完整视频,具有摄像机输入、NTSC 兼容视频输出和 NTSC 编码器,可在标准电视演播室监视器上显示。最重要的是,每个像素都在通用计算机的计算机程序控制之下。它可能是第一个完全数字化的 8 位帧缓冲系统——目前还没有定论。39
图 7.20 显示了 1974 年在 PARC 上 SuperPaint 的菜单显示。顶部的 HSB 颜色选择器滑块——用于色调、饱和度和亮度——代表了我对 Digital Light 的第一个算法贡献。他们替换了 Shoup 最初在那里编程的 RGB 滑块(用于红色、绿色和蓝色)。我曾尝试将粉红色与 RGB 滑块混合,但无法做到。我让迪克添加一个艺术家友好的机制。我解释说,粉红色很容易混合,如果你可以从色环中选择一种色调——在这种情况下为红色——然后添加白色以使其变亮。或者选择橙色并添加黑色使其变暗为棕色。“从来没有人这样做过,”他说。所以我做到了,一夜之间实现了这个低调的水果概念。使用新的滑块,增加白色降低的饱和度。添加黑色减少值或亮度。40
SuperPaint 不是计算机图形,尽管我花了数年时间才理解到足以做出这样的声明。中心教条没有生效。在上一章中,我将计算机图形定义为将几何模型渲染为像素。但迪克舒普的像素并没有为几何服务。SuperPaint(几乎)没有几何图形。
迪克当然知道如何将几何图形渲染成像素。正如我们在黎明一章中讨论的那样,他在 1973 年在 PARC,但不是在 SuperPaint 中渲染的没有锯齿的直线和车轮就是证明。SuperPaint 的菜单上有几个基于几何的工具。例如,单击最上面一行图标(图 7.20)中从左数第四个图标会调用画线工具。SuperPaint 然后会在用户选择的任意两点之间渲染一条锯齿状的线段。它可以渲染一个矩形。那是几何上的。
图 7.20
使用手持设备(在这种情况下是平板电脑上的触控笔)在显示器上移动光标是当时的一个新概念。迪克必须向每个新用户解释在平板电脑上单击并拖动“向下”的交互技术,同时跟随显示屏上的“向上”光标。从 1973 年的 SuperPaint 开始,彩色的菜单、图标、光标和滑块开始逐渐普及。
那么,什么是 SuperPaint?它是一种图片创作工具,但不是计算机图形学。它是基于像素的,但不是图像处理系统。它是互动的,但不是电子游戏。然而,它绝对是数码光,因为它是通过像素来调节的。
我以前使用的一些术语对于描述 SuperPaint 或一般的绘画程序特别有价值。关键的区别在于创意空间和展示空间。计算机图形学的创造力发生在一个看不见的创意空间中。它驻留在计算机内存中的几何模型中。它成为了当它通过像素渲染到显示空间时可见。绘画程序中的创造力直接发生在显示空间中。绘画程序是不区分创意空间和显示空间的图像创建系统。像素(通常)不是几何图形的渲染,也不是模拟现实。它们是由用户艺术家从头开始创建的。他们不尊重采样定理,因为他们不采样连续体。他们只是。这是一种冗长的说法,他们不尊重中央教条。典型的计算机图形程序就像摄影。您以完美的方式排列 3D 对象,然后从特定的角度拍摄它们。绘画程序就像绘画一样。他们让你从头开始制作你想要的任何图像。
但是绘画程序绝对是合成计算机图形的一部分,而不是分析图像处理。图像处理没有创意空间。现代世界已经把绘画和图像处理混为一谈,所以原来的区别是模糊的。Adobe Photoshop 最初设计用于处理摄影图像,但现代版本包括各种风格的绘画和几何定义元素的结合。
绘画程序背后有一个模型。但这只是一个比喻,不是几何学,也不是物理学。这是用画笔在画布上绘画的行为。像 SuperPaint 这样的绘画程序用计算机程序模拟了这个比喻。画笔只是一组像素。在图 7.20 中,当前选择的画笔(用红色箭头表示)是一个中等大小的圆盘。画笔的“手柄”是在其平板电脑上与 SuperPaint 一起使用的物理触控笔。它可能是一只老鼠,已经在 PARC 的其他地方使用,但 Shoup 发现这只老鼠很笨拙——“就像用一块肥皂画画。”
在 SuperPaint 中,当用户在平板电脑上滑动(无压力)触控笔时,显示屏上的光标会跟踪移动。所以光标总是显示当前位置。当用户在触控笔上施加压力,关闭笔尖上的一个小开关时,当前画笔的副本将写入该位置的帧缓冲区,并立即以当前颜色显示。只要您对触控笔保持压力,副本就会被写入帧缓冲区并因此显示出来,速度与可以从数位板读取触控笔位置一样快。这是当今与计算机交互的一种显而易见的方式,但当时并非如此。
究竟是什么被复制或绘制到帧缓冲区中?它是一组具有当前画笔形状、当前颜色并以当前位置为中心的像素。笔画由用户使用触控笔所走的路径定义,由用户的移动指示的一系列分离点。如果这些点足够接近,则连续绘制到帧缓冲区中的画笔副本会重叠并看起来形成一个连续的笔划。但中风实际上并不是连续的。在那些糟糕的过去,很容易将数位板划得太快以至于计算机跟不上,留下一个“划”的分开的笔刷副本。
最终,随着摩尔定律使计算机变得更快,编写的绘画程序可以沿着几何定义的路径呈现连续的笔触。但这需要多年的发展。一开始,渲染连续笔画的速度慢得令人尴尬。我们已经在这些页面中遇到过这个概念。第 6 章中 Ravi Shankar 的样条演示是一个几何定义的笔画。正是缓慢的渲染——我在平板电脑上的手势和笔画渲染到帧缓冲区之间的暂停——在那个演示中引起了惊喜和惊奇。
Adobe Photoshop 是这一系列图片创建工具的主要产物,尽管它最初被设计为一个图像处理程序,用于交互式地按摩用相机拍摄的像素,而不是用画笔制作的。绘画隐喻是一个强有力的隐喻。SuperPaint 或更高版本的 Photoshop 等计算机程序将其重新解释为使用由用户控制的画笔定义的本地操作以交互方式创建或修改图片。
在我第一次接触 SuperPaint 和彩色视频系统后,我给 PARC 写了一封信,其中包含以下观察结果(与许多人一样,系统及其主要程序令人困惑):“我看到这台机器的第一个直觉是它会成为制作动画电影的好工具。” 为了准备正式加入他们,我从普雷斯顿·布莱尔(Preston Blair)的一本著名的操作手册中自学了角色动画的基础知识,这位伟大的动画师在迪斯尼的幻想曲(1940)中制作了风信子河马舞蹈。图 7.21 显示了反弹和走动的封面和页面。41
当我在 1974 年到达 PARC 时,早期 Genesys 动画程序的创始人 Ron Baecker 正在那里进行长期逗留。哈佛动画师埃里克·马丁也是如此。他们和我一样被 Dick Shoup 的 SuperPaint 系统所吸引。当然,Eric 很快就绘制并录制了一个可爱的弹跳球动画,The Ever-Popular Bouncing Ball (1974),该动画可在线获取。42
在我的第一个动画中,有一个来自 Blair 书中的步行循环。然后我开始走一个海盗的头、一个泡菜、一把锤子和一个西红柿——以及大卫·迪弗朗西斯科(David DiFrancesco)头部的数字扫描。虽然我们不知道,但我们正在迈出最终通往皮克斯和第一部数字电影的道路上的一些第一步。
当我遇到艺术家 David DiFrancesco 时,他已经在全球范围内寻找融合计算机和艺术的方法。允许获得国家艺术基金会的资助他在 1970 年代初与 Computer Image Corporation 的 Lee Harrison III 一起工作。大卫去东京是为了接触哈里森的一个作品,叫做 Scanimate,一种模拟动画机器,1974 年他刚刚回来,当时他看到迪克舒普在旧金山进行了 SuperPaint 演示。大卫从观众那里问迪克 SuperPaint 与哈里森的 Scanimate 有什么共同点。这是一个很好的问题,因为迪克和李哈里森是好朋友,迪克很了解 Scanimate。他鼓励大卫给 PARC 打电话。43
图 7.21
但是当他的许多电话开始打来时,迪克让我处理这些电话。大卫不停的恳求,加上他不同寻常的幽默,对我施了魔法。我终于心软了,建议我们在 SuperPaint 上分享一个晚上的“干扰”。这意味着时间顺序的干扰——只有一个手写笔——一个艺术家会画一段时间,然后另一个会添加到画中,然后第一个艺术家会修改第二个的作品,等等。
大卫喜欢机器就像他喜欢艺术一样。他喜欢任何类型的机器——相机、汽车、飞机,尤其是摩托车。他是个摩托车狂——品味高雅。他的收藏品以 1938 年的 Brough Superior 和 1951 年的 Vincent Black Shadow 为特色。因为他喜欢所有的机器,所以他忍受了使用早期数字机器的固有折磨。他可以通过痛苦来获得结果。这都是冒险的一部分!
这种对困难的漠不关心是早期计算机艺术家的特征。另一位大卫,大卫米勒,将在 PARC 与我们同在,并以 David Em 的身份继续加入帕萨迪纳喷气推进实验室的未来同事吉姆·布林。Em 将在 JPL 的荧光灯、咆哮和结冰的空调以及机构绿墙中受苦多年,以创作他的日落美丽的数字绘画和奇怪的瓷砖 3D 风景。您必须在他们的童年时期爱上这些机器并设想它们的成长。你必须渴望发现的过程,并相信这项技术会在“几年内”变得不那么苛刻。我们还没有学会援引摩尔定律,但这就是我们正在做的事情。
David DiFrancesco 熟悉他所说的“艺术商业”,他很快建议我们向 NEA 申请拨款,以利用 SuperPaint 提供的新艺术媒介——彩色光栅图形。他需要这笔钱,因为他只是非正式地在 PARC 工作,而我想做艺术并称之为艺术。作为纽约大学教授,我获得了几项国家科学基金会的资助。NSF 拨款提案有 40 页厚,一式 20 份提交,所以当大卫告诉我 NEA 是如何运作的时,我松了一口气。您只需要提交一个页面!他知道,因为他目前靠第二次 NEA 资助生活。伴随单页的艺术家作品是主要考虑因素。我们使用 Dick Shoup 的系统制作了一段视频,并提交了一份一页的赠款提案,巩固了我们的关系并共同投票。44
现在还不算太快。不久之后,我在 1975 年 1 月 16 日被解雇了。当我问我为什么被解雇时,鲍勃·泰勒的老板杰里·埃尔金德告诉我,施乐决定不做彩色。45
“但是,”我难以置信地争辩道,“颜色就是未来,而你完全拥有它。”
“这可能是真的,但非黑即白是公司的决定。”
我不应该感到惊讶。鲍勃泰勒早些时候开了一枪警告。有一天他找我问:“你不觉得Shoup的系统很难用吗?纽曼的方法不是更好吗?” 他指的是威廉·纽曼,他和 SuperPaint 在同一个房间的一个角落里工作。威廉就是我们在计算章节中遇到的那个人,他是艾伦·图灵的导师马克斯·纽曼的儿子,曾与图灵本人玩过某种形式的大富翁。威廉当时正在 PARC 的 Alto 计算机上设计具有 1 位像素的黑白图形。“不!” 我在里面尖叫,而在外面悄悄地反对。泰勒显然不明白。
所以施乐吹掉了彩色图形,就像他们在大约一年后错过了个人电脑一样。46
无论我们离开 PARC 的原因是什么,David DiFrancesco 和我都需要找到“下一个帧缓冲区”来满足我们希望获得的 NEA 拨款。随着摩尔定律的无情改进,帧缓冲区的大小将从几年后,PARC 的大型微波炉变成了单个图形卡,然后变成了现在图形芯片的一小部分。但在当时,帧缓冲区是一种稀有且昂贵的野兽。
我们听说盐湖城的 Evans & Sutherland 正在建造下一个,所以那是我们的第一个目的地。纯属巧合,当我们驶入 E&S 的停车场时,一辆黄色和黑色的莲花在我们身边飞驰而过。Jim Kajiya 跳了出来,头发垂到腰间,甚至比我的还要长。Kajiya 是一位杰出的工程师和理论家——后来成为加州理工学院的教授——正在 E&S 构建下一个帧缓冲区。几十年来,他将是一位重要的同事。47
我们希望能够访问这个新生的帧缓冲区的希望很快就破灭了。虽然我们从来没有提到“艺术”这个词,但很明显,艺术是我们的目的。这在政治上与犹他州与国防相关的资金来源——美国计算机图形的军事暴君——并不相符。我们正要失望地离开时,有人提到一位名叫亚历山大·舒尔(Alexander Schure)博士的来自长岛的“疯狂的富人”最近经过并“买下了眼前的一切”。“他买了帧缓冲吗?” 我急忙问道。是的!他想拍动画电影!以茶壶着称的马丁·纽厄尔(Martin Newell)第二天就要启程前往富人所在的纽约理工学院咨询。他答应给我打电话报告。
纽厄尔的建议很快就来了,“如果我是你,我会跳上下一班飞机。” 大卫和我就是这样做的。
“我们应该找谁?” 我问过另一个犹他州的熟人。
“埃德·卡特莫尔。但要小心,他是虔诚的摩门教徒。”
“这不是问题。”
X(1975–1980)我们的愿景将加速时间,最终将其删除。
——亚历山大·舒尔,NYIT 48总裁兼联合创始人
长岛的富人亚历山大·舒尔(图 7.22)是我们的“亚历克斯叔叔”,因为一个纯粹但惊人的巧合。我在 PARC 附近的加利福尼亚室友是 Richard 和 Sandra Gilbert。理查德告诉我,他在纽约的叔叔正在做我在 PARC 所做的事情,但我解雇了他。在计算机图形的小世界里,我怎么会不知道这样的人呢?理查,经济学家,一定是误会了。但是,当我第一次去纽约理工学院旅行回来时,我对在那里遇到的那个人感到非常兴奋,理查德惊呼道:“Alvy!他就是我一直想告诉你的那个叔叔。” 49
图 7.22
亚历克斯叔叔认为自己是下一个沃尔特迪斯尼。你几乎可以看到错觉是如何形成的。一位家庭朋友 Alexander Nikolaievich Prokofiev de Seversky(图 7.23)、Alex 叔叔的“Sasha”以及纽约理工学院的受托人,曾在一部迪斯尼电影中出现。
De Seversky 在第一次世界大战中是俄罗斯的王牌海军飞行员。他是 1917 年革命后在俄罗斯不受欢迎的贵族,因此他乘坐西伯利亚大铁路前往符拉迪沃斯托克,然后乘坐日本轮船抵达旧金山,逃离了俄罗斯1918 年 4 月 21 日。50
图 7.23
De Severksy 在纽约定居,在那里他创办了一家名为 Seversky Aircraft 的飞机公司,后来更名为 Republic Aviation。珍珠港事件发生后不久,他出版了一本颇具影响力的著作《通过空中力量取得胜利》,该书主张建立一支独立的美国空军。1943 年,迪斯尼公司把这本书变成了一部同名的动画宣传片,沃尔特热心支持这个项目。De Seversky 本人在影片中出现了大约 10 分钟。当胜利在纽约开业时,迪斯尼一家和他一起在长岛呆了几天。51
1964 年,de Seversky 帮助 NYIT 购买了校园内最令人印象深刻的建筑(图 7.24),最初是为 Alfred I. du Pont 家族建造的。它最终将在几部电影中扮演角色,秃鹰的三天(1975)和亚瑟(1981)。舒尔为他的朋友和恩人将这座建筑改名为 de Seversky 豪宅。它将成为 1970 年代 NYIT 视频工作室未来的家,通过树林直接连接到“隔壁”的计算机图形实验室。de Seversky 的豪宅也将成为我和大卫·迪弗朗西斯科与亚历克斯叔叔第一次见面的戏剧性场景,由 Ed Catmull 和 Malcolm Blanchard 引导他到场。52
在 Schure 听说过计算机图形学之前,他已经在校园里建立了一个 100 人的动画工作室来制作一部长篇动画电影Tubby the Tuba。它使用了我在有关电影和动画的章节中描述的相同的老式 cel 动画技术,迪士尼用来制作Victory Through Air Power的技术。
但后来一位旅行推销员向 Alex Schure 推销计算机图形学。Pete Ferentinos 是 Evans & Sutherland 的东海岸销售代表。费伦蒂诺斯对 NYIT 打了一个冷电话,很快 Schure 就对计算机图形设备可以为Tubby the Tuba节省的成本表示热情。作为推销的一部分,Ferentinos 安排 Schure 参观盐湖城的 E&S,并会见 Dave Evans 和 Ivan Sutherland。53
图 7.24
这一强大的攻势将舒尔推到了边缘。他为 NYIT 购买了几款 E&S 产品。然后埃文斯问他谁来运行这些设备,并补充说:“你只是错过了合适的人。” 他指的是刚毕业的 Ed Catmull。那是 1974 年,大约在我被带出 PARC 的同一时间。
当 Ed 于 1974 年从犹他大学获得博士学位时,他的一位顾问 Ivan Sutherland 正在好莱坞创建一家使用计算机的公司。埃德希望这家公司能成为他进入电影制作,尤其是动画制作的门票。在 2017 年 5 月的 Skype 对话中,我向 Sutherland 询问了该公司的情况。
“我们早了 10 年,”萨瑟兰谈到他 1974 年的尝试时说,他和联合创始人格伦弗莱克计划将其称为图片/设计集团。萨瑟兰和弗莱克当时做了几项设计工作,但从来没有足够的工作来支持一家公司。它从未离开地面。54
埃德不能再等了。他有一个妻子和一个年幼的孩子要抚养。因此,他在波士顿的一家计算机辅助设计公司 Applicon 找到了一份工作。1974 年,纽约理工学院的 Alex Schure 打来电话时,他就在那儿。尽管 Ed 在 Applicon 只工作了一个月左右,但他抓住了 Schure 提供的机会——在纽约理工大学运行 E&S 设备并制作动画电影。Ed 的未来在于面向图片的计算机图形学,而不是 CAD。
Malcolm Blanchard 是犹他州计算机科学系的另一位毕业生,也是 Ed 在 Applicon 的同事,他于 1974 年底与他一起来到纽约理工大学。55
几个月后,即 1975 年初,“实验室”的后两名成员加入了,当时所有新机器都已交付。他们是大卫·迪弗朗西斯科和我,来自施乐 PARC,鲍勃·泰勒创立的实验室。所以两个 ARPA 线程,Sutherland 和 Taylor 的,在 NYIT 交织在一起。
1975 年,犹他州的基于几何的计算机图形学与 PARC 的基于像素的图形学结合,为该组织播下了种子,最终被称为皮克斯。这是艺术和技术的有力结合。另一种说法是,中心法则内部(犹他州)和中心法则外部(PARC)联手。纽约理工学院的四位最初的实验室成员——Ed、Malcolm、David 和我——将在 1980 年的卢卡斯影业和 1986 年的皮克斯集团的后期表现中保持在一起。
埃德和马尔科姆是已婚男人,埃德很快有了第二个孩子。他们基本上在工作日保持朝九晚五的日程安排,周末不工作。但大卫和我仍然单身,日以继夜地工作,周末也是如此,创作艺术——尤其是在帧缓冲区到达之后。我们只在必要时才睡觉。
大卫靠他的 NEA 拨款过活,但它已经用完了。我们还没有听说我们一起提出的赠款的命运。大卫检查了一下,发现 NEA 失去了我们的艺术提交,这让他很生气,也让我很沮丧。为了弥补,他们同意实地考察。但这正是我们想要的!很难解释我们在做什么,但很容易展示。
NEA 派出了艺术家 Stan Vanderbeek 和一位名叫 Nancy Rains 的官员。范德贝克很有名,在控制论的偶然性(在第 6 章中提到)和扩展电影(在这一章中)都有特色。事实上,范德贝克创造了“扩展电影”一词。56
下午 4 点,我和大卫在长岛曼哈塞特火车站接了团队,这是现场访问的最后一天的最后一个小时。他们正在履行 NEA 的职责,但只是勉强而已。“我们需要赶上五点钟的火车,”雷恩斯命令道。这意味着我们只有三十分钟的时间参观。“好吧,但我们认为你不会想要。”
他们没有。从我们在 PARC 的日子开始,David 和我就习惯于一看到彩色像素和光栅图形就张大嘴巴。NEA 对也不例外。我们聊了几个小时,看着照片,还拍了照片。最后,大约凌晨 4 点,他们建议是时候返回曼哈顿著名的阿冈昆酒店了。我们把他们赶了进来,我们四个人都洋溢着幸福和友情。在旅馆里,范德贝克把手伸进车窗,最后摇了摇,说:“好吧,你们这些孩子拿到了补助金!”
在纽约理工学院以西约 10 英里的长岛北岸有一台不同寻常的实时计算机图形机。它模拟了一艘通过纽约市港口的大型油轮。现在很难相信,但是在阿拉斯加埃克森瓦尔迪兹石油泄漏灾难发生之前,有一个计划允许巨型油轮进入那个重要的港口。由于大型油轮需要一英里的转弯半径才能进行右转或左转,而且按照这个标准,纽约港是一个狭小的空间,船长必须先在模拟器上练习。这个想法很疯狂,从未发生过,但模拟器是真实的。后来,当噩梦终于在 1989 年发生在广阔的威廉王子湾时,它被用来重现和研究埃克森瓦尔迪兹的事故。57
盐湖城的 Evans & Sutherland 创建了海港模拟器,名称很笨拙,即计算机辅助运筹学设施或 CAORF(发音为“Kay orf”)。它于 1975 年 7 月安装在长岛金斯角的美国商船学院。你进入了一座砖房——船头!——通过舷窗通往“桥”。马桶是一个“头”。在里面,你发现自己在船桥上,配有导向轮、扫描雷达、速度控制杆和雾喇叭控制装置。所有这些都是真实的,而不是计算机模拟。
(无玻璃)窗户的景色令人惊讶。它完全是计算机生成的,充满了你的视觉空间。桥上的真实设备是虚幻计算机模拟的人机界面。飞行员看到了简化的纽约港的 240 度展示,其中包括自由女神像、维拉萨诺海峡大桥、帝国大厦和纽约市的其他天际线。当你用轮子驾驶时,“油轮”穿过这个计算机生成的港口。58
CAORF 由 NASA-2 的 Rod Rougelot 和 Bob Schumacker 和第一个彩色像素设计。他们于 1972 年 10 月离开 GE 并加入 E&S。Rougelot 自然成为 CAORF 的项目工程师,而 Schumacker 也在他的团队中。“我们把公司押在了这上面,”Rougelot 告诉我。它奏效了。航空业从油轮模拟器中了解到,也可以模拟驾驶飞机。航空公司飞行模拟器使 E&S 取得了成功。59
油轮模拟器的软件由 John Warnock 管理。他后来在 PARC,甚至后来共同创立了 Adobe。但与此同时,他的 E&S 商店在加利福尼亚。一位名叫克里斯汀·巴顿 (Christine Barton) 的年轻女性在 CAORF 的软件上工作,然后来到长岛,将其安装在这座令人敬畏的建筑中。
Schumacker 于 1974 年参加了 Ed Catmull 在犹他大学的论文答辩。因此,在 CAORF 装置上,他邀请 Ed 到附近的纽约理工学院访问。这可能就是克里斯汀认识埃德的方式。她的说法是,她得知 NYIT 就在附近,并且最近购买了 E&S 设备,所以她打电话给 Ed 并在那里拜访了他。无论如何,在 Ed 描述了他在做什么之后,Christine 向他要了一份工作,他雇用了她。1975 年,她成为 NYIT 小组的第一位女性计算机科学家,也是该小组的第五位成员。她是早期以男性为主的计算机图形学领域为数不多的女性之一。60
Christine 拥有网络专业知识。她曾与互联网的早期 ARPAnet 前身合作。在 LAN 成为通用术语之前,她会将我们在 NYIT 的多台计算机连接到局域网中。她的网络服务器还将帧缓冲区分配给竞争用户,这是当时世界上没有其他人遇到的问题。大多数地方都幸运地拥有一个能够以 512 x 512 像素分辨率保存一个 8 位视频图像(256 色)的帧缓冲区。NYIT 在其鼎盛时期拥有18个这样的帧缓冲区。可以使用 Christine 的系统以各种方式配置它们。例如,可以将其中的三个组合在一起形成 24 位全彩色视频图像(1600 万色)。61
克里斯汀创造了艺术。和我们一样,她在 NYIT 的新生系统上制作了动画。她住在霍洛威学院,这是另一座与纽约理工学院有关的豪宅,离校园一英里左右。
“克里斯蒂”,正如我们当时所说的,她带我们参观了新的 CAORF 模拟器,从而赢得了大卫·迪弗朗西斯科和我的喜爱。她有一个熟人,一名现场员工,晚上让我们进入设施。那是乐趣开始的时候。我们驾驶油轮,将模拟器发挥到极致。我们把天空染成了红色。我们以每小时 200 英里的速度驾驶油轮,低于水位 40 英尺,高于 40 英尺。我们全速飞过自由女神像,看看会发生什么,飞过帝国大厦。当然,什么也没发生——它是只是一个模拟。E&S 程序员没有在这些结构中放入任何信息,因为不应该有人在那里。用来模拟它们的多边形在被击中时就消失了——锐利的边缘从屏幕上退去——露出黑色的虚无,就像把彩色玻璃窗打碎到黑暗中一样。
图 7.25
以法莲·科恩著,1977 年。
图 7.25 是 1977 年实验室人员的示意图:(左起)Ephraim、Garland Stern 和 Lance Williams、Tom Duff 和 Christine Barton,Duane Palyka 和 Ed Catmull 隔着很远,而我和 David DiFrancesco 与我们的车辆.
1975 年,影响我们图形和电影制作未来的两个人来到了纽约理工大学。来自犹他大学的 Lance Williams 和 Garland Stern 与我们一起度过了第一个夏天。兰斯和加兰是技术组合,身高差不多,都留着金色的长发——加兰扎着马尾辫。他们谈了同样的话,一起制定了计划。他们都在第二年夏天又来了,然后永久地加入了我们。62
多面的 Lance Williams 对我个人来说尤其重要。他和我一直在争吵,但正是这种智力上的较量让我们双方都受益——反正我也是。他向我介绍了威廉·巴勒斯 (William Burroughs) 的《裸体午餐》,这本书对我们这些刚刚离开 60 年代的人来说特别引人入胜,还向我介绍了布鲁斯·斯普林斯汀 (Bruce Springsteen)。
更重要的是,Lance 教会了我如何对光栅图像进行抗锯齿处理。他是从我在第 6 章中提到的音频专家 Tom Stockham 那里学到的,他教了一代犹他州学生有关采样的知识。Lance 还向我介绍了孙悟空,这是一个很受欢迎的亚洲文学人物,他将在我们的电影未来出现。63
加兰·斯特恩(Garland Stern)一旦永久加入纽约理工学院,就编写了二维动画程序,该程序将告知皮克斯未来与迪士尼的关系。
摩尔定律还没有为 3D 动画提供足够的动力,因此了解计算机如何最好地帮助 2D 动画师是当时的问题。起初答案并不明显。
Ed Catmull 写了我们都认为是 cel 动画的计算机方法。. . 但有一个问题。他的动画程序,称为Tween,是一个出色的二维中间程序。它使用的插值与第 6 章中描述的关键帧动画程序非常相似,Nestor Burtnyk 和 Marceli Wein 于 1970 年在加拿大创建。动画师 Peter Foldes 在Burtnyk-Wein 中间系统上创作了具有里程碑意义的电影饥饿( Le Faim) (1974)。纽约理工学院的动画师最终制作了一部 22 分钟的电视短片,名为Measure for Measure (1980),部分内容是在 Tween 上。但他们遇到了困难。
Ed 解决了他们提出的每一个问题,但他无法解决的内在缺陷是二维计算机动画比三维更难这一不直观的事实。考虑一个人在侧面向左走,摆动他的手臂。我们知道,凭借我们的人类智慧,远(或右)臂出现在男人的后面,消失在后面,然后在他走路时重新出现在他的面前。然后它在男人面前改变方向,消失在背后,然后重新出现在男人的背后。但是计算机不知道这一点。它如何从一个位置插入到另一个位置?“后面”是什么意思?是什么让这六个位置刚刚描述了一个物体的运动?在三个维度上,手臂是一个在空间中平稳移动的物体。
受过经典训练的 NYIT 动画工作人员发现 Tween 令人生畏。对于习惯用铅笔和纸的人来说,这并不自然。图 7.26 是Measure for Measure中罗马士兵的角色“模型表” ,说明了他们感到沮丧的原因。基于此模型表的关键帧中的每条编号曲线对应于下一个关键帧中的类似曲线,其中士兵处于稍微改变的位置——例如,头部稍微转动,右臂抬起。Tween 通过动画师必须提供的指令将每条曲线插值到其对应的曲线上。如果关键帧比如第 10 帧,下一个关键帧是第 14 帧,然后 Tween 将创建三个由这些插值曲线组成的中间帧。
图 7.26
图 7.27
图 7.27 显示了仅移动士兵右臂的困难。在最左边寻找曲线编号 39。图 7.27(左)显示了曲线 39 从其在关键帧 10 中的位置到其在关键帧 14 中的位置沿直线路径(虚线)以相等的时间步长移动。这只是一个愚蠢的插值。计算机不知道这是一只手臂,需要像手臂一样在一个单元中移动。请注意,曲线向运动的中间方向缩短,然后再次变长。所以这个手臂会随着它的移动而改变大小和外观体积。并且中间帧在帧之间移动相同的距离。动画师几乎从不想要一个僵硬和不优雅的动作。
为了实现令人愉悦的动作,纽约理工学院的动画师必须告诉 Tween 要遵循的路径以及如何在时间间隔内间隔。在图 7.27(右)中,手臂边缘沿曲线(虚线)移动并保持长度。它在(必然)相等的时间步长中移动不同的距离。它慢慢地移动,然后快速,然后又缓慢地移动。在最坏的情况下,动画师同样必须告诉每一行如何移动——仅此罗马就有一百多行。
对于经典动画师来说,补间插值不仅是一种全新的工作方式,而且我们计算机图形学人员也发现它本质上也很困难。这对我们来说是一个重要的教训。由于电影的定义要求它是完全数字化的——不允许手绘——它几乎肯定需要 3D 角色模型。第三个维度,以及它的连接性、对象和深度的概念,将产生巨大的影响。
与此同时,Garland Stern 创建了一个二维动画程序,纽约理工学院的动画师们可以直观地理解——一个允许手绘的程序。他们使用它(除了 Tween 之外)来生成Measure for Measure。它允许他们在铅笔和纸,一如往常。他们——而不是计算机——做了关键帧插值,就像他们一直做的那样。他们手工制作了所有中间帧。但其他一切都是在计算机上完成的——着墨、不透明、构图和拍摄。原始图纸是模拟的,但其他一切都是数字的。64
Garland 的程序,称为SoftCel,是一个“扫描和绘制”系统。动画师用铅笔和纸在标准 cel 动画纸上绘制每一帧,就像他们往常一样。每帧中的单独字符被绘制在单独的纸片上,并分别手工绘制在中间。使用扫描仪,加兰将动画师制作的每幅画都数字化了。也就是说,他通过对其进行采样并将如此获得的灰度像素存储在计算机中的数字文件中来制作每幅图的数字版本。像素是拍摄的,不是制作的。曲线没有锯齿,因为它们不是来自硬边高频几何图形的渲染。扫描仪保留了实际铅笔画的平滑度。65
每一帧都被带入帧缓冲区,以便在计算机显示器上看到。通常它是嘈杂的,由灰尘产生的虚假点,例如,在扫描期间在纸张上或扫描仪玻璃上。SoftCel 用户将消除扫描图像的噪声并对其执行其他图像处理任务,例如增亮和对比度增强。一项重要的工作是关闭所有打开的曲线。动画师可能认为他画了一个封闭的椭圆,而事实上,他在其中留下了一个小间隙。对于下一步——用纯色填充一个区域——关闭这些间隙至关重要。您可以将本段中的所有过程视为在传统 cel 动画中使用印度墨水在透明 cel 上上墨的数字版本。
然后像素创建阶段接管了扫描和绘画的绘画部分。在纽约理工大学的头几个月,我编写了一个名为TintFill的程序来完成传统 cel 动画中不透明步骤的数字等效。正如我在电影和动画章节中所描述的,经典的遮光剂用印度墨水在 cel 上绘制线条内的区域。就像孩子的图画书一样,重点是保持纯色画在线条内,而不是越过它们。66
同样,TintFill 用单一的纯色填充封闭区域(例如 Roman 的右臂和手指)。用户将选择一种颜色,然后单击要填充它的区域。TintFill 完成了剩下的工作。如果 TintFill 在封闭曲线中发现间隙,则颜色会泄漏并淹没整个绘图,因此需要关闭区域定义曲线中的所有间隙。
一个字符的所有区域都以这种方式依次填充。结果被保存到计算机上的数字文件中。此时,最终作品的每一帧都存在多个文件。如果一个场景中有三个动画角色,那么该场景中的每一帧都有三个单独的数字文件,每个角色一个。
同时,一位艺术家使用数字绘画程序将背景场景绘制到帧缓冲区中,并将每个场景保存到数字文件中。由于我在 Xerox PARC 使用 Dick Shoup 的 SuperPaint 时就知道如何编写绘画程序,所以我在 NYIT 早期的另一个主要程序是Paint,这是一个具有 256 种颜色的 8 位绘画程序。还有其他几个 8 位绘图程序,包括 Garland Stern 在犹他州编写并随身携带的一个。因为我想要一个不同的用户界面,所以我自己编写了一个,然后我与专业的 cel 动画背景艺术家 Paul Xander 合作,使这个工具成为他使用的有效工具。67
最后一步是将一帧的所有数字文件组合或“合成”成最终帧,并将其发送到胶片打印机或录像机。首先将帧的背景场景从数字文件恢复到帧缓冲区。然后每个字符层将在背景上方以适当的顺序恢复。角色图层的透明部分可以让后面的图像显示出来,尤其是背景。Alpha 通道使这种合成成为可能。
我们在纽约理工学院接触的一切都是第一次。我们曾经尝试过列出第一名,但很快就长得离谱。但寿命最长、影响最大的事件几乎是偶然发生的。Ed Catmull 和我发明了alpha 通道。
在实验室历史的早期和一天傍晚,我们的赞助人 Alex Schure 叔叔拜访并问我:“我们拥有世界上最好的计算机图形,对吗?” 我向他保证我们做到了。“我们如何留在前面?” 当时我们只有一个帧缓冲区,512 x 512 像素,每像素 8 位(256 色)。它花费了舒尔 80,000 美元。我告诉他,如果他再给我们买两个 8 位帧缓冲区,那么我们可以将它们组合在一起并拥有一个 24 位帧缓冲区(超过 1600 万种颜色)。我解释了 256 色和 16 兆色之间的区别,世界上没有人有这种能力。
我不相信 Schure 理解我,但几周后他宣布他又买了五个8 位的东西,所以我们会有两个24 位的东西!五个新的 8 位帧缓冲区每个花费 60,000 美元。因此,第一个 RGB 或全彩色 24 位帧缓冲区花费了他 200,000 美元——最初购买 8 位的 8 万美元加上购买两个新的 8 位的 12 万美元——但第二个只花费了 180,000 美元。我们不仅拥有世界上第一个全彩色帧缓冲区,而且还拥有其中两个。他在我们身上花了相当于今天的 1,700,000 多美元,就我这么说。回想起来,这种慷慨比当时更让我印象深刻。当时,我们很兴奋。
他很快就会以大约 40,000 美元的价格为我们再购买 12 个 8 位帧缓冲区——摩尔定律在起作用。这总计额外增加了 480,000 美元,或今天约为 1,900,000 美元。大约在 1978 年,我们拥有比地球上任何其他人都多的全彩色像素。我们是计算机图形界羡慕的对象。对于校准,您今天的手机拥有的像素内存容量比实验室所有 18 个帧缓冲区的总和还要多。而且,作为对所有这一切背后的源源不断的驱动力的提醒,摩尔定律从那时起已经提升了八个数量级。68
我们为全 24 位 RGB 疯狂。我在 1977 年将具有 8 位像素的 Paint 推广到具有 24 位像素的Paint3。我将其称为 Paint3,因为它使用了三个帧缓冲区。它是世界上第一个“全彩”或 24 位绘画程序。它具有 16 种百万色——如此之多,以至于艺术家可以用不会产生锯齿的软边刷子进行绘画。颜色融合在一起,就像它们与真正的油漆一样。“这就像用冰淇淋蛋筒作画,”有人令人难忘地说道。69
我很快将所有面向像素的程序推广到 24 位版本。有了这么多的记忆,Ed 和我很容易一天就能为每张数码照片添加第四个频道。我们称它为 Alpha 通道。我们创建它是为了解决一个特定问题,没有意识到 alpha 会变得多么重要。现代数字成像世界依赖于它。
Ed 试图解决的问题是一个长期存在的问题,即我之前讨论过的隐藏表面问题——从虚拟相机的角度来看,场景的哪些表面是可见的?不必渲染隐藏的表面,从而节省大量计算时间。已经有几种算法可以解决这个问题。
Ed 正在开发一个新的,假设虚拟相机看到一个二维世界,它被分成一系列小方块,就像透过一个窗纱一样。(稍后会详细介绍。)请注意,小方块是模型的几何定义区域,而不是像素。
Ed 的算法计算了他模型中每个几何对象与每个小正方形区域的交集。如果几个对象与一个正方形相交,则它进一步确定每个对象的多少区域对虚拟相机可见。换句话说,他解决了每个小正方形区域的隐藏表面问题,并用一个像素表示结果。每个像素代表其位置周围的方形几何区域。问题是确定最能代表单个正方形区域内所有复杂性的一种颜色。
该正方形区域的最终前景像素颜色是贡献对象颜色的平均值,每种颜色均由其占据的正方形区域加权。它的不透明度是被物体遮挡的正方形区域。如果他们完全遮蔽了广场,然后那里的前景像素完全不透明。如果他们完全错过了正方形,那么像素是完全透明的。否则它是部分不透明的。
Ed 想针对任何二维背景渲染三维前景对象。为了测试算法,他从预设的背景图片开始,这样他就可以知道每个小方块背后的最终颜色,以防被前景物体遮挡。但他不想总是有一个“硬连线”的背景。
他对我说:“我希望有一些简单的方法可以在不同的背景下检查我的算法。” 我们聊了几分钟,很快就看到了解决方案。在他计算每个最终像素的某个时刻,他的算法如上所述计算了结果前景颜色及其部分不透明度。将其与背景颜色相结合是一个可分离的问题。所以我们把它分开了。
我编写了在 NYIT 使用的程序,用于在计算机文件中保存和恢复数字图像,这些文件通常存储在数字磁盘上。这些是第一个全彩色、24 位保存和恢复程序,因为我们是第一个拥有 24 位像素的程序。我立刻知道如何解决 Ed 的问题。我会简单地为这些程序中的每个像素添加第四个通道。它将保持像素的不透明度。
如果一个像素是不透明的,它的 8 位 alpha 通道的值为 255(全为 1)。如果它是透明的,它的 alpha 值为 0(全为 0)。两者之间有 254 种可能的部分不透明度。所以每个图像像素现在有 32 位,红色、绿色、蓝色和 alpha 各 8 位。我们称它们为 RGBA 像素。Christine Barton 的帧缓冲区分配系统让我们从网络上的四个 8 位帧缓冲区中配置一个 32 位帧缓冲区。
Ed 将更改他的算法,使其仅计算每个像素的前景色及其不透明度,并将结果保存到计算机文件中,该文件支持新的第四个通道。换句话说,他会忽略背景颜色,直到后面的步骤。我将重写恢复程序,以便它能够识别新的 alpha 通道并使用它来正确地将 Ed 计算的前景色与已经显示在帧缓冲区中的任意背景结合起来。
为什么我们称它为alpha?因为这是我们在公式中用于组合前景图像和背景图像的术语。简而言之,我将它们称为f和b。Alpha 是希腊字母α,但我们以这种方式发音公式:“alpha f plus one minus alpha b ”。这个想法是 alpha 就像一个控制旋钮,当你转动它时,它会从 0 到 1 平滑地变化。“alpha f ”是指 alpha 乘以f。因此,转动控制旋钮会导致这种对结果的贡献从无前景图像平滑地变化到完整的前景图像。“一减阿尔法b ”表示“一减阿尔法”乘以乙。转动旋钮会导致此贡献从完整背景图像变为无背景图像。
图 7.28
图 7.29
这个想法是只转动一个控制旋钮,并将两个贡献加在一起。所以旋钮在一个极端(alpha 为 0)会导致没有前景图像加上完整的背景图像——只有背景。在另一个旋钮极端(alpha 为 1)处,结果是完整的前景图像加上没有背景图像——只有前景。Alpha 的值直接反映了前景图像的不透明度。
旋钮处于中间位置(alpha 为 0.5)会产生一半前景和一半背景的图像。在其四分之一的位置(alpha 为 0.25),生成的图像是四分之一的前景图像加上四分之三的背景图像。如果您将旋钮从一个极端平滑地转动到另一个极端,您将获得从背景图像到前景图像的完整电影交叉溶解。一幅图像平滑地替换了另一幅图像。图 7.28 显示了从蓝色方块上的白色十字到白色方块上的红色圆圈的交叉融合,因为 alpha 从 0 到 1 以 0.25 的步长变化。
我一直在谈论好像整个图像只有一个 alpha 值(不透明度)。事实上,这就是图 7.28 所示的内容。但是通过在每个像素中引入一个 alpha 通道,我们允许每个像素具有不同的不透明度。相同的公式在逐个像素的基础上起作用。一些前景像素可以是透明的,一些是不透明的,还有一些是部分不透明的,这意味着背景像素可以在这些位置部分显示出来。因此,RGBA 像素将其颜色保留在 RGB 通道中,并说明该颜色对 A 或 alpha 通道的重要性。因此 32 位像素成为我们的标准。
以逐像素方式使用的 Alpha 如图 7.29 所示。前景物体只是圆形的红色圆盘,没有背景。它外面的所有像素都是透明的(或沿磁盘边缘部分透明)。最右边的图像是合成在最左边的方形图像上的红色圆盘。这是在逐个像素的基础上使用红色圆盘的 alpha 通道完成的。图像序列在其他方面就像上面的那样:全局 alpha 用于将一个图像交叉溶解到另一个图像上——在这种情况下,一个成形的图像在一个矩形图像上。
Alpha 是一个微不足道的开发——至少我们当时是这么认为的。我们第一个到达那里是因为我们是第一个拥有大量像素内存的人。这是一个非常简单的想法,以至于我在第二天早上就完全实现了它,并为我们的编程手册提供了完整的页面,其中将新类型的像素描述为 RGBA 表示红色、绿色、蓝色和 alpha,从而为今天仍在使用的新频道。Ed 也很快完成了他的工作,改变了他的隐藏表面程序,以新的 RGBA 格式存储每个前景像素的第四个值,即其不透明度。
为了运行他的测试,Ed 只需执行以下步骤: (1) 使用我的“旧”24 位恢复程序将任何RGB 背景图像b提取到帧缓冲区中。假设它到处都是不透明的。(2) 使用我的新 32 位恢复程序将 RGBA 前景图像f提取到同一帧缓冲区中,这是他的程序以新格式保存的图像。恢复程序在每个像素处执行“alpha f加一减 alpha b ”公式,其中前景图像中每个像素处的 A 保存了 Ed 在那里计算的 alpha 值(不透明度)。背景图像在阿尔法“控制旋钮”将前景图像从不透明变为透明的地方显示出来。
新的 Alpha 通道可以轻松地将前景字符放置在背景图像上。被纯色填充的角色部分是不透明的。描绘彩色区域的扫描曲线具有柔和的边缘,这意味着它们是部分透明的。这让他们与背后的一切优雅地结合在一起。数字 cel 的所有其他部分都是透明的,alpha 为 0。
在扫描和绘画中为铅笔画创建 Alpha 通道很简单。绘图本身就是它自己的 Alpha 通道——嗯,实际上绘图的负片是。一幅画是用黑色铅笔在白色背景上绘制的,因此它的底片将是黑色背景上的白色图画。假设扫描的图形位于 8 位帧缓冲区中,其中 255(所有位为 1)表示白色像素,0(所有位为 0)表示黑色像素。扫描绘图中的灰色将介于 255 和 0 之间。让我们选择其中一个作为示例 - 例如灰度值 100。要获得绘图的 alpha 通道,请从白色 (255) 中减去每个像素。这就是接受否定的意思。因此,白色像素的 alpha 值为 255–255,即 0。它将是透明的。黑色像素的 alpha 值为 255–0 或 255。它将是不透明的。不透明(155/255 或约 61% 不透明)。任何颜色不透明的区域都将完全不透明,当然,使用 alpha 255。
阿尔法可能看起来微不足道,但它是深刻的。我花了很多年才意识到它的全部深度。几年后,我们在卢卡斯影业的同事汤姆·波特和汤姆·达夫将想法演变的下一步,他们在新频道中添加了一个“代数”——基本想法的一个重要扩展。他们观察到,如果将颜色“预乘”到一个像素中而不是原始颜色存储在像素中,则每次恢复图片时都可以节省大量乘法。当乘法缓慢且昂贵时,这又回来了。我们四个人因为我们对数字电影制作的共同贡献而获得了技术奥斯卡奖 - 组合数字图像的通用方法。
如果没有 alpha,今天的许多流行程序都不会是现在的样子。Adobe Photoshop 和 Microsoft PowerPoint 浮现在脑海中。但即使是 Windows 和 MacOS 等操作系统也使用 alpha 来做浮动图标、圆角和部分透明的窗口。
几年后,我将在皮克斯之后创办的公司,名为 Altamira Software,将建立在一个逻辑上和深刻地从增强的 Alpha 通道中产生的想法:数字图像不必是矩形的。预乘 alpha 最终让我们能够推翻矩形的暴政。考虑上面的红色圆盘。其形状由其 Alpha 通道的非零部分定义。具有 alpha 0 的像素并非出于所有实际目的而存在。圆盘是一个圆形的图像对象。它是由像素组成的精灵(或成形图像),而不是几何形状。我和我的同事基于这个概念编写了一个图像合成程序 Altamira Composer ,并在 1995 年将它(和公司)卖给了微软。
阿尔法没有什么需要服从中心法则,尽管阿尔法当然经常用于它的服务。绘图程序及其相关程序(例如 Photoshop)不受中心法则的约束,Composer 也不受约束。
拥有如此多受过大学训练的成员,纽约理工学院实验室类似于一个学术部门也就不足为奇了。这个地方是自愿和合议的。出版物和学术荣誉比薪水或头衔更重要。就像在大学里,没有人想当系主任,所以 Ed Catmull 承担了这个吃力不讨好的职责。人们没有被分配任务,尽管 Ed 可能偶尔会提出一项建议。通常,每个人都只是弄清楚需要做什么并自愿去做。但每个人都知道,纽约理工大学是天赐之物,是一个资金雄厚的研究天堂,我们都尽可能地努力工作。这个花园每天都有新发现伊甸园!我们必须为所有新的植物和动物命名——并收集所有低垂的果实。
埃德低调的管理风格很适合当初那一小群任性的人。但这些年来,我们一点一点地开始感受到他作为一名真正的经理在工作。他为实验室和一个小型数字音频小组增加了硬件设计,如果 Ed 不是经理,这两者都不会发生。他利用他在犹他大学的人脉,偶尔为实验室增加人员——或者至少是暑期探访——。Lance Williams 和 Garland Stern 是 1975 年和 1976 年这些夏季访客中的第一批。他们中的许多人像 Lance 和 Garland 一样“卡住”,成为了正式员工。
没有坚持的人是 Jim Blinn,他在 1976 年夏天从犹他州加入我们。他过去是,现在仍然是一个身材高大、身材瘦长的长发男人,经常穿着一件他母亲织的特别绿色的毛衣。他是一位才华横溢的技术明星,给人一种阴森森的严厉,但这是对慷慨和诙谐幽默的伪装。70
在那次访问结束之前,Blinn 制作了一个纹理映射的 3D 茶奶精(来自 Martin Newell 著名的茶具)和一个绕圈跑的 3D“人”,他的表面相对于固定的阴影具有逼真的阴影光源。在犹他大学和纽约理工学院之间穿梭时,他还尝试了一种称为凹凸贴图的新着色技术。值得进一步讨论,因为就像纹理映射一样,它是 Digital Light 中样本和几何图形的另一种定义震撼的结合。在这两种情况下,像素都成为几何对象的创意空间模型的一部分。也就是说,在这两种情况下,像素都会从显示空间跃迁到创意空间。
与纹理映射一样,一个图像控制另一个图像的外观。也就是说,一个样本数组控制几何表面的外观,因为它被渲染到另一个数组中。在这种情况下,控制图像会影响表面的外观形状。图 7.30 显示了凹凸贴图如何使橙色球体看起来像橙色。这很明显,因为几何形状根本没有改变。查看“橙色”的边缘,注意平滑、无凹凸的轮廓。这是另一个好莱坞的假前技巧,只要明显的颠簸相对于整体几何形状很小,效果就很好。如果我没有指出来,你会注意到那无颠簸的轮廓吗?
凹凸贴图将早期的着色技术提高了摩尔定律的两个数量级。它将多次上升的概念(还记得那些小旗杆吗?)发挥到了极致。在球体的最终渲染中,控制图像像素(如图 7.30 中所示)在每个像素处改变向上的方向。在最简单的平面着色情况下,up 只是每个三角形中心的旗杆。然后 Gouraud 在每个三角形的角落引入了上升的概念——倾斜的旗杆。他们定义了一个“上升表面”,你可以想象它漂浮在三角形上方。当每个最终像素被渲染到显示器中时,用于对其进行适当着色的 up 取自 ups 浮动表面中的相应位置。
图 7.30
凹凸贴图将三角形上少数几个点(例如角)的上升次数增加到每个点的上升次数。凹凸贴图中的每个像素都可以有不同的向上。使用经典的采样定理重建 - 扩展每个样本并添加 - 从凹凸贴图中的 ups 生成一个 ups 表面,以创建一个浮动在三角形上方的表面,如您所愿。你看不到这个浮动表面,但你可以看到它引起的阴影扰动——凹凸。
无需深入三角杂草,只需说在表面上逐点愚弄 ups 可以用来让我们看到表面上并不真正存在的凸起——从某种意义上说,它们不在几何模型。
Blinn 于 1976 年在犹他州和 NYIT 的圣诞节访问期间首次提出这个想法,但直到 1978 年他将其转化为在年度计算机图形会议 Siggraph 上发表的论文时才完善它。与此同时,这是他在犹他州的博士论文的一部分。图 7.31 显示了他的第一个动画凹凸贴图球体(具有无凹凸轮廓),按光栅扫描顺序,从 1977 年开始。71
Blinn 最终加入了帕萨迪纳的喷气推进实验室。他在那里开花,并因制作航海者号飞船飞越电影而声名鹊起。每部电影都模拟了航海者号经过木星等行星之一的过程。对于纹理贴图,他使用了航海者号本身实际送回喷气推进实验室的行星的最新照片。这让他忙了好几年,并把 JPL 放在了计算机图形学重要地点的地图上。
图 7.31
1977 年,Ed 将另外两名犹他州的同事带到了长岛。Ephraim Cohen 和 Duane Palyka (“Pal kah”) 都不是犹他州的正式学生,但他们让自己变得有用,所以 Ed 在 NYIT 聘请了他们。两人都是艺术家和程序员。
Ephraim 是前一章中的艺术家,他在 MIT 的 TX-2 上与 Ron Baecker 的 Genesys 动画程序一起工作。作为一名艺术家,他以揭示性的漫画让我们高兴,例如 1977 年左右的实验室人员之一(图 7.25)。他为实验室贡献了许多像素处理程序,包括另一个绘画程序。多年后,在纽约理工学院之后,他最引人注目的 Digital Light 贡献——真正的 Digital Light 寺庙——将是他帮助设计和实施的曼哈顿纳斯达克时代广场多层立面。
Duane Palyka 被收录在 1968 年的经典节目 Cybernetic Serendipity中,并出现在一本名为Artist and Computer的书的封面上,他用电脑绘画程序和一面镜子画了一张自己的照片。他贡献了 NYIT 为数不多的渲染 3D 物体的程序之一。慢得令人痛苦主要是为了提醒我们我们多么需要摩尔定律来实现它的承诺。72
我们在 NYIT 的实验室已经开始使用 Tween、TintFill 和 Paint3 进行二维数字生产,但我们的软件开发环境仍停留在黑暗时代。我们永远不会以这么慢的速度去看电影。我不是在谈论低摩尔定律功率,而是低效的软件工具。我们知道在目前的摩尔定律水平上我们可以做得比我们更好。我们需要的是一种“好的”编程语言。
Ed Catmull 和我都知道坏人是什么样的。我们都教过 Fortran 编程语言——正如我们所说,它是由 IBM 强加给公众的——但都讨厌它。我们很早就决定不在 NYIT 使用它。相反,我们将使用繁琐的汇编语言(参见图灵章节)进行编程,并等待一种好的编程语言出现。
然后有一天,我们的克制得到了回报。我们了解了一种称为 C 的优雅编程语言(是的,我们被告知只有一个字母)。它是作为新操作系统的一部分出现的,称为 Unix。两者都很可爱且合乎逻辑,我们立即以大约 100 美元的大学价格收养了它们。Ron Baecker 曾向 Ed 讲述过 Unix,这是该人的又一贡献。
正如我在图灵一章中解释的那样,操作系统是一个始终在运行的程序,例如 Windows、MacOS 或 Android OS(操作系统的 OS)。它故意处于无限循环中。它负责业务:哪些应用程序正在运行?他们需要多少内存?需要哪些输入或输出设备?是否存在需要立即关注的电气紧急情况?它还处理无数其他“管道”问题。这是一种需要特殊思维的深度程序。系统程序员就是那些人。
贝尔实验室的 Ken Thompson 和 Dennis Ritchie 创造了 Unix,Ritchie 设计了 C 语言,他们因此获得了 1983 年的图灵奖。Unix 现在是世界上的基本操作系统之一——MacOS 是一种改编——C 是它非常流行的编程语言。Ken Thompson 亲自将 Unix C 的早期副本交给了纽约理工大学。他直接从新泽西州的贝尔实验室乘坐黄色 Corvette Stingray 抵达。73
那时,我们实验室里没有人关心系统编程,也没有人能胜任 Unix。我们需要一位 Unix 专家。Ron Baecker 再次提出了一个宝贵的建议:我们应该考虑他在多伦多大学指导的一个学生。这就是我们认识汤姆·达夫的方式。1976 年,他在 NYIT 面试了这份工作。他新鲜而与众不同,不是来自犹他州、E&S 或 PARC。实验室里唯一的另一个加拿大人是亚历克斯叔叔本人。74
但汤姆出奇地害羞。在他的采访之旅中,他几乎没有说话。因此,他与各种实验室成员的谈话很短。我们很快发现自己都在摆弄拇指,想知道在预定出发前的剩余时间里,我们沉默的访客该怎么办。
有人建议汤姆尝试一下加兰·斯特恩(Garland Stern)创建的 Unix 游戏——一个多选文本游戏。一个正确的答案把你带到了另一个级别的 Unix 难度。游戏的目标是教我们其他人 Unix 是如何工作的。我们谁也解决不了。Unix 的细节太晦涩难懂了——即使对 Garland 来说,他也知道得比我们其他人多。
当汤姆听说这个游戏时,他抓起一个键盘,在大约五分钟内完成了它。这对他来说是儿戏。他显然是我们的 Unix 专家!我们抢购了他——直到最近(2021 年),他一直在皮克斯工作,他是一位黑客大师和老大爷。他的天才远远超出了 Unix,还延伸到了计算机图形学。
尽管 Digital Light 有很多部分,但我选择只关注通往数字电影的途径。也就是说,我专注于他们在千禧年大数字融合中的作用。所以,我在这里忽略了所有的图像处理、所有的实时模拟器和游戏、所有的应用程序界面,以及所有不适用于长篇角色动画的计算机图形。出于实际原因——一章的篇幅限制,以及我不想让外行读者用无穷无尽的名字列表淹没——我坚持通向皮克斯、梦工厂和蓝天这三个公司的路径。这意味着,除了少数例外,我几乎没有提到参与数字光革命的计算机图形部分的许多其他公司和研究人员。这也意味着我对梦工厂和蓝天的轻视。
由于我的个人经验是 NYIT-Lucasfilm-Pixar 轴,我会比其他人更多地谈论这条道路。但这种处理方式远不及那条非凡赛道的详细历史。相反,我只关注那些导致数字电影的故事的软件线索。而且这一章肯定与另外两条路径的详细历史相去甚远——太平洋数据影像——梦工厂和 MAGI——蓝天。我更感兴趣的是展示这些股如何相互作用和相互影响,而不是展示千禧年其他两条通往数字电影的主要途径的所有人和技术。
我把它留给别人写详细的历史。梦工厂和蓝天的那些还没有写出来。在 NYIT–Lucasfilm 的岁月里,我几乎无法超越迈克尔鲁宾 2006 年出版的著作《Droidmaker》。鲁宾基于对我们这些在场的人的采访,它几乎在所有细节上都是准确的。同样,我推荐《皮克斯之触》( The Pixar Touch),这是历史学家大卫·普莱斯(David Price)在 2008 年稍晚一点的卢卡斯影业和皮克斯早期的精彩历史,他是根据档案材料而不是新闻传闻撰写的。在这里,我只讲述了 NYIT 和卢卡斯影业在那些继续组建以皮克斯这个名字命名的电影制作团队的成员方面的高点。75
特别是,汤姆·达夫、埃德·卡特莫尔、大卫·迪弗朗西斯科和我将前往卢卡斯影业,然后前往皮克斯。NYIT 的另外两个人也将走上同样的道路。马尔科姆布兰查德是最初的四名骑士之一,早在我们其他人之前就离开了纽约理工学院,但他会在卢卡斯影业重新加入我们。比赛后期加入纽约理工学院的新人是拉尔夫·古根海姆,他将在随后转会卢卡斯影业的过程中发挥关键作用。Ed 和我将共同创立 Pixar,而 David、Malcolm 和 Ralph 都将成为创始员工。76
但我们并不是唯一致力于实现大数字融合的人。在康奈尔大学和 MAGI,人们都在探索技术的边缘。
纽约理工学院的计算机图形实验室位于纽约市以东几英里的长岛。就在城市北部的威彻斯特县,是另一个早期的计算机图形中心,即数学应用集团公司 (MAGI)。1972 年,它在其其他数学产品中添加了计算机图形学。因此 NYIT 和 MAGI 是下游图形学的所在地。
北部同时期的所在地是康奈尔大学的唐·格林伯格(Don Greenberg)的小组。它以马克·莱沃伊和其他格林伯格学生为特色,他们在 1972 年创作了康奈尔电影。
多年来,我们在 NYIT 进行了一两次实地考察,但与我们联系更紧密的团体是康奈尔大学——一个像我们一样的学术团体。格林伯格确保我们要么访问他在伊萨卡的设施,要么他和他的学生每年访问 NYIT 一次或两次。
我们有一位富有的赞助人,亚历克斯舒尔叔叔,所以我们在顶级设备上总是领先于康奈尔大学,但康奈尔大学从来没有落后太多。我们在 NYIT 拥有了世界上第一个 24 位帧缓冲区。大约一年后,康奈尔大学有了一个。我们与纽约理工学院的动画师合作。很快,康奈尔大学的马克·莱沃伊就与以弗林特斯通闻名的汉娜-巴贝拉动画电影公司合作。我终于在 1978 年将我在 1974 年在 Xerox PARC 实施的 HSB(又名 HSV)颜色变换算法写成了一篇论文。在同一期刊上,康奈尔大学的 George Joblove 也发表了类似的颜色算法。77
与MAGI的早期关系也形成了。它始于 NYIT 的 David DiFrancesco 和他为实验室寻找具有电影质量的电影录像机。他的关注点很快缩小到两家公司,Celco 和 Dicomed。出于同样的原因——电脑动画——MAGI 也对电影录音机感兴趣,并正在考虑 Celco。方便的是,Celco 顾问 Carl Ludwig 在 MAGI 召开了一次会议。因此,大约在 1975 年或 1976 年,我们与 MAGI 进行了第一次重大接触。大卫最终选择使用 Dicomed。但他与卡尔·路德维希建立了终生的友谊,我们第一次在 MAGI 内部看到。十多年后,卡尔将成为蓝天工作室的联合创始人。78
1974 年,我在 Xerox PARC 使用彩色光栅图形制作了一个艺术视频。我称之为Vidbits。当我从加利福尼亚回到纽约市的视频艺术界时,它成了我的名片。他们从未见过这样的事情。79
因此,当著名的视频艺术家 Ed Emshwiller 来纽约理工学院拍摄电影时,我抓住了这个机会。“Emsh”在巴黎开始了他的抽象油画创作生涯。在 1950 年代,他因为Galaxy和The Magazine of Fantasy & Science Fiction绘画封面而出名。然后他发现了 16 毫米电影制作,并成为该媒体的艺术领袖。然后是视频艺术的领导者。然后是视频磁盘艺术。
我们从 PBS 电视特别节目中发现了 Emsh。令我们惊讶的是,我们得知他住在附近莱维敦的长岛!有人说:“我们请他过来吧。” 我说:“我认为我们不需要。他会找到我们的。” 80
这就是发生的事情。显然,Emshwiller 正在追踪新媒体的高科技优势。正如预期的那样,有一天他出现在实验室,并宣布他有一个古根海姆奖学金来制作一部三小时的电影。他想和我们一起使用它,他有六个月的时间。我们爆发出一阵笑声。我们不得不向他解释,心烦意乱和困惑,这是早期的日子。他很幸运能在六个月内完成三分钟。
但我们致力于它,因此开始了我生命中第二次重要的艺术合作,继大卫·迪弗朗切斯科之后。我是一个有艺术倾向的技术型人。我喜欢艺术。Emsh 是一个具有艺术倾向的人,具有技术倾向。他热爱技术。我们一拍即合,就像大卫和我之前所做的一样。
我们的工作风格是这样的:Emsh 会呈现一个艺术概念。例如,他提出的第一个是一张人脸穿过一块石头。我从我的技术知识和对摩尔定律的理解中做出了回应:“我们总有一天会做到的,Emsh,但现在还不行。但是如果你这样修改你的概念,那我就可以了。” 我解释说,如果只看到正面,我可以制作一张穿过石头的脸的二维表示。然后他说:“好吧,如果你能做到,那怎么样。. 。” 如此反复,直到我们共同决定了一个我可以在那个痛苦缓慢的计算中真正实现的艺术想法。这是另一种形式的“干扰”。图 7.32(左)显示了我们两个在Sunstone上工作(Emsh 在我的右边) 。太阳图像诡异地漂浮在彩色显示屏之外的空间中,这是相机在两次曝光的中间被轻微推挤的结果——房间里的灯打开捕捉我们,然后关闭捕捉屏幕。我们同意,这个“错误”完美地捕捉到了我们的创造性思维。
图 7.32
(右)来自Sunstone的一帧,1979 年,由 Ed Emshwiller 创作。
纽约理工学院的两位同事 Lance Williams 和 Garland Stern 也参加了会议。兰斯贡献了一个在屏幕上漂浮的“舌头”,加兰完成了一个模拟视频记录的二维实时数字化,该视频记录描绘了埃姆什的儿子斯通尼(这件作品的名字就是以此命名的)。Garland 使用同一台机器对这些视频帧进行数字化,这与他在他的扫描和绘画系统中用于对动画师的绘图进行数字化。他从现实世界中,从单色录像带中获取这些像素,而不是用计算机制作它们。但是,他没有使用灰色像素,而是通过 8 位颜色图来运行它们以获得彩虹伪色效果。因此, Sunstone是图像处理数字光和计算机图形数字光的混合体。
Sunstone将成为纽约现代艺术博物馆收藏的第一个彩色光栅图形。它不是数字视频——它还不存在——但每一帧都是像素光栅,因此是数字光。只有交付媒介还没有数字化。直到 1998 年 HDTV 标准化时,才发生这种情况。
我们为Sunstone使用了三种不同的 Digital Light 技术:二维交互式绘制像素、数字化实时视频和完全非实时的三维计算机图形。
绘制的像素是使用 Paint3 创建的。使用 Garland Stern 为 NYIT 的扫描和绘制系统构建的数字化系统对视频像素进行实时数字化。但是在 1979 年,摩尔定律根本没有足够的能力在长时间的动画中渲染几个物体的完整 3D 场景——去掉锯齿。当然,那会到来,但它还没有完全存在。所以我写了一个程序叫Texas(用于纹理应用系统)。它将世界简化为嵌入在三维世界中的二维平面。我把每架飞机称为舞台制作中的“公寓”,这些公寓合起来就是“舞台布景”。每个公寓都贴有图片纹理。通过改变每一帧的纹理,一个平面可以在它穿过三维空间时显示二维动画。也就是说,这些公寓可以以任何方式放置在三维“舞台”上。中心教条在这个程式化的世界中生效:一个虚拟摄像机观察舞台,并以文艺复兴时期的视角将其视图渲染为最终帧以供展示。
为了衡量此时所涉及的痛苦——即使限制为单位——在Sunstone中仅 18 秒长的爆炸立方体序列需要 56 小时来计算。但它是 3D 完全抗锯齿纹理映射光栅图形。其中三个立方体面在飞入太空时带有二维动画——一张是 Emsh 手绘的动画,另一张是 Garland Stern 拍摄的实时视频,第三张是我制作的动画太阳。
Emsh 于 1979 年底离开实验室,成为 CalArts 的教务长,这所学校正是沃尔特·迪斯尼 (Walt Disney) 为他的工作室培训动画师而创立的学校。我第一次去加州艺术学院是去看 Emsh,最后是在 1990 年与数百人一起庆祝他的生命并哀悼他的死。CalArts 将在我们的未来占据显着地位。埃姆什和我开发的工作风格预示着艺术创意和技术创意的结合,最终在皮克斯会很好地发挥作用。
在过去的几年里,纽约理工学院发生了一个警示事件。Ed Catmull 聘请了来自犹他州的博士学位的 Jim Clark 加入实验室并制造了一个头戴式显示器——就像 Ivan Sutherland 的一样。吉姆帮助揭示了我们的赞助人亚历克斯叔叔也是一个小暴君,尽管不在拿破仑、斯大林或山姆大叔的联盟中。
吉姆对我来说是一个惊喜。他来自德克萨斯州,说话和我一样。作为宅男,我们很快一拍即合。他在德克萨斯州普莱恩维尤长大,距离我的家乡新墨西哥州克洛维斯以东约 80 英里。但相似之处到此为止。吉姆被踢了出于战斗的普莱恩维尤高中。他加入了海军,在一次智力测试中发现自己是一个非常聪明的人。因此,他参加了夜校并设法被各所大学录取,最终在犹他大学获得计算机图形学博士学位。81
但在纽约理工学院,他和亚历克斯舒尔几乎立即发生了冲突。回头看,我明白为什么了。与实验室的其他人不同,吉姆有很强的创业精神。舒尔将他视为竞争对手,而不是贡献者。Jim 很快发现了问题,意识到这对 Schure 不起作用,于是开始写信寻找另一份工作。他在实验室用文字处理器写了它们,这已经变得很普遍了。
一天早上,舒尔用这些信件的打印件与吉姆对质,并指责他准备窃取我们的秘密并将它们带到别处。舒尔当场解雇了他。这对我们没有任何意义。Jim并没有隐瞒他正在寻找其他地方去的事实。而且他太聪明了,不需要窃取我们的技术。我们的“秘密”是我们拥有当时最好的硬件。在该硬件上实施的想法是公共知识。简而言之,我们不相信舒尔的指控。82
我们也不知道打印输出的来源。舒尔无法进行数字窥探。那只能意味着我们在实验室里有一颗痣!我们知道它可能是谁,但一直不确定。没关系,因为Jim离开了,露出了愤怒、报复心的舒尔。他不公平地对待我们的朋友,所以我们的警告旗帜上升了。
至于企业家吉姆·克拉克(Jim Clark),他将继续与他人共同创立了对计算机图形学很重要的硬件公司 Silicon Graphics,以及后来的互联网浏览器先驱公司 Netscape。
我们越来越怀疑舒尔和他制作电影的能力。埃德和我几乎每年都去迪斯尼朝圣,并继续这样做。我们认为,应该是迪斯尼资助我们,而不是舒尔。他们是我们俩小时候都喜欢的动画公司,他们有钱。我们确信沃尔特本人不会犹豫。但每年在迪士尼都是一样的老故事。首先是,“你们男孩会做泡泡吗?” 嗯,不,那一年我们做不到,但第二年他们发现我们还做不到其他事情——比如蒸汽或烟雾。
在 1977 年 1 月的迪斯尼之旅中,我和 Ed 由 Dick Shoup 陪同。我们会见了动画负责人 Don Duckwall(是的!),并举办了一场研讨会。从我的笔记中:
我们对 Don Duckwall 的出现感到惊讶和高兴,并表达了积极的(但不是绝大多数)反应:“我相信你现在可以做泡泡了。” 他建议他可能对我们的特殊效果感兴趣。大约 30 人的一大群人出现在研讨会上——大多数是热爱他们所看到的东西——尤其是 3-D 的东西的年轻热切的家伙。83
但这次访问的最大收获是会见了伟大的老动画师弗兰克托马斯和奥利约翰斯顿。我们也向他们展示了我们的东西。
他们似乎很喜欢他们所看到的——问了很多问题——但不知道如何处理这些信息。84
弗兰克和奥利将一直是我们热情的朋友,直到他们 90 多岁时去世。
然而,迪士尼的技术人员确切地知道我们能做什么。其中之一,戴夫斯奈德,警告我们不要指望他的更高管理层会发生任何事情。他们不会支持我们。另一方面,“Ub 会的,”他说。从某种意义上说,艾沃克斯是迪斯尼与沃尔特的联合创始人,斯奈德公开钦佩他。85
这些旅行中最尴尬的一次发生在我们纽约理工学院逗留快结束时。大约一周后,亚历克斯·舒尔参观了迪士尼。“哦,艾德和阿尔维刚刚在这里,”迪斯尼的某个人告诉他——后来在电话中担心地告诉我们。舒尔从来没有提到过,我们也没有。显然,两次访问都没有任何结果,但我们很紧张,目睹了舒尔对吉姆克拉克的治疗。
NYIT 的计算机图形学小组设法不以任何方式参与Tubby the Tuba (1975)(图 7.33)。David DiFrancesco 和我致力于标题概念。幸运的是,他们从来没有得到任何牵引力。有一天,我们都聚集在曼哈顿米高梅的放映室,观看Tubby的首映。这不怎么样。一部 cel 动画电影可能出现的所有问题都有——例如,框架上的灰尘,以及画线下的阴影。
但Tubby确实起到了激励我们多年的愿景的目的。不是Tubby本身,而是它的生产。Tubby制作的单调乏味,当我们了解它的细节时,我们清楚地知道,计算机可以极大地帮助电影制作,如果没有其他原因,只是为了减轻工作量,跟踪大量的物流,增加质量。从那以后,我们突然想到,有一天,不知何故,我们可以成为第一个制作完全由计算机生成的电影的团体。Lance Williams 很快提出了一部名为The Works的电影,该电影由一个名为 Ipso Facto 的机器人主演,作为第一辆车。但 Ed 和我做了粗略的摩尔定律计算,并意识到工程在当时是不可行的。我们谁都不知道要实现第一部数字电影的愿景还需要 20 年。
图 7.33
为什么花了这么长时间?大多数情况下,摩尔定律还不够,可以这么说。但我们知道这只是时间问题。从技术上讲,我们必须解决几个关键问题。最重要的是运动模糊问题。在艺术上,我们必须弄清楚如何优雅地将艺术家与我们的机器连接起来。Tween 示例向我们展示了一个困难的界面是行不通的。我们必须掌握一种为 3D 对象设置动画的新方法。我们必须找到可以舒适地使用我们的硬件和软件的艺术家。
X(1980–1985)然后突然间地球移动了——比平时更剧烈。1979 年初的一个早晨,卢卡斯影业的乔治·卢卡斯联系了纽约理工学院的拉尔夫·古根海姆。好吧,不是那个人本人,而是代表鲍勃·金迪(Bob Gindy)。
我们原以为有一天我们会接到迪斯尼的电话,但这个电话是一个惊喜。我们唯一确定的是,卢卡斯影业的《星球大战》(1977)以其视觉效果震惊了所有人——尤其是我们——。有传言说卢卡斯曾使用电脑制作这部电影,尽管我们不确定这究竟意味着什么。我们肯定注意到,他包含了我们的朋友拉里·库珀(Larry Cuba)由计算机生成的一系列黑白书法作品——用于策划对死星的袭击。卢卡斯是一位成功的电影制片人,而舒尔则不然。也许这是我们的重大突破?
根据拉尔夫的说法,金迪在 1979 年 1 月或 2 月给他打电话,说他是卢卡斯影业的开发主管,乔治·卢卡斯正在寻求用计算机技术使电影业现代化。
“乔治有四个他想追求的项目。”
“好吧,他们是什么?” 拉尔夫回答。
Gindy 提到了计算机化剪辑、计算机化声音设计和混音以及计算机化特效。
“第四个呢?” 拉尔夫问。
“公司账簿的计算机化会计。”
他这样说,就好像这和其他三个人一样具有挑战性。他不断地用花絮来打断谈话,说加州马林县的生活有多美好,那里的房地产价值有多高。
拉尔夫问:“对不起,你说你的头衔是什么?”
“嗯,”金迪承认,“我是乔治的房地产开发主管。”
他接着说:“我们公司没有人对计算机一无所知,所以我打电话给斯坦福大学计算机系的负责人。当我描述乔治想要什么时,他说,‘我们在这里并没有真正做那种工作,但你应该联系 CMU 的 Raj Reddy。他喜欢那些图形的东西。'” 1
拉尔夫·古根海姆 (Ralph Guggenheim) 是雷迪认识的卡内基梅隆大学 (Carnegie Mellon University) 刚毕业的学生,这导致金迪最终给纽约理工学院的拉尔夫打电话。Ed 和我在 Gerry House 的一个房间里会面,这是 NYIT 的豪宅,是实验室的所在地,这时 Ralph 突然说 Lucas 打来了电话——意思是 Gindy。由于舒尔对吉姆克拉克的态度,我们立即让拉尔夫闭嘴,并告诉他在他说其他话之前先关上门。
后来我们才发现,卢卡斯无意在他的电影中使用我们的图形绘画技巧。他只是想要数字专业知识来使好莱坞使用的机器现代化,并帮助电影制作的后勤工作。但我们突然得出结论,卢卡斯希望我们为他的电影制作内容,就像拉里古巴所做的那样。毕竟,“电脑特效”和会计一样在金迪的名单上。
下一步是进行正式接触并表达兴趣。因为有痣,我和 Ed 不信任纽约理工学院的电脑。我们开车离开校园,来到附近格伦科夫的一家打字机租赁公司,租了一台巨大的黑色老式铸铁打字机——让人联想到德国的 Enigma 机器。然后我们前往 Ed 的家中给 Lucasfilm 写了一封信。
这将是我们一生中最重要的一封信。几个小时以来,Ed 和我小心翼翼地把它拼凑起来,然后我把它打了出来。我的一个遗憾是我们没有保留那封信的副本。但我确实记得一些亮点。其中一个特别不寻常。我们拥有世界上最舒适的实验室,我们不想走下坡路。因此,重要的是,我们敦促卢卡斯影业的某个人访问纽约理工学院,看看我们受到了怎样的待遇——甚至是奢侈的待遇。我们明确表示访问应该是匿名的。
卢卡斯影业确实造访过,但几乎不是匿名的。房地产经理鲍勃·金迪来了。他足够安静,但伴随着他的是卢卡斯影业的奥斯卡奖获得者特殊视觉效果负责人 Richard Edlund。Edlund 戴着一个巨大的皮带扣,上面印着大字母的星球大战。埃德和我咽了咽口水,但继续示威。有人对皮带扣发表了评论,但没有人推断出它的重要性。2
我问 Edlund 在那重要的一天剩下的时间里他在做什么。他去过曼哈顿吗?不,他没有。我晚上要进去,我告诉他,他欢迎加入我。“我没有任何特别的计划。我只是进去看看会发生什么。” 他也很乐意这样做。我们那天晚上的大部分时间都在曼哈顿附近闲逛。那是一个温暖的夜晚,街上有很多人。三张纸牌锐器出来了,埃德伦德在工作中拍下了他们的照片。我们找到了进入村庄和参加前卫音乐会的路。我们谈了又谈。最后,大约凌晨 4 点,我们在一家咖啡馆喝着阿芙佳朵酒结束了这一夜。我相信我们那天晚上建立的友谊会在卢卡斯影业受到热烈欢迎。我从来没有想过 Edlund 不是在寻找我们的内容,而是我们的硬件和软件专业知识。
埃德和我很快受邀参观了位于洛杉矶的卢卡斯影业总部蛋厂。我们去了一趟,遇到了卢卡斯影业的总裁查尔斯·韦伯。我们没有见到乔治卢卡斯,但取得了进展。随后,埃德被邀请进行第二次访问,这次是在旧金山附近的马林县与乔治卢卡斯会面,该县很快将成为卢卡斯影业的新总部。
卢卡斯影业聘请 Ed 作为第二次会议的结果。根据 Ed 的说法,Lucas 对 Ed 愿意将我们的竞争对手命名为替代员工印象深刻,但事实并非如此。Ed 于 1979 年年中离开 NYIT,以实现 Lucas 在硬件和软件方面的愿景——我们仍然相信 Lucas 打算将我们的数字图像包含在他的电影中。3
我们的计划是:聘请 Ed。完毕。然后当他可以的时候,他会把我和大卫·迪弗朗西斯科带进来。我们不能突袭 NYIT 或带走它的任何技术。
作为计划的一部分,为了避开诉讼舒尔,正如我们所说,大卫和我“洗白”了自己,正如我们所说,于 1979 年 10 月离开纽约理工大学,并在加利福尼亚州帕萨迪纳的喷气推进实验室加入我们的老朋友吉姆·布林. 我们和他一起在 Carl Sagan 的Cosmos电视连续剧中工作。这是与 NYIT 的彻底决裂,并打算采取这种方式。我们和吉姆在喷气推进实验室的老板鲍勃·霍尔兹曼非常清楚,一旦埃德向北加州的卢卡斯影业招手,我们就会离开。他说:“也许我可以改变你的想法。” “我们不这么认为,”我们都回答道。卢卡斯影业具有巨大的吸引力。这是一家真正的电影公司。
在卢卡斯影业的几个月里,埃德决定他需要启动三个硬件项目——计算机图形、数字音频和视频编辑——以满足卢卡斯的硬件和软件愿景。(卢卡斯会在大约一年后要求他添加第四个项目,游戏。)我们应该注意到当时没有任何关于数字内容的明确说明。同样,我们只是假设它是有意的。
因为我会指导计算机图形部分,所以当我还在 JPL 时,Ed 就开始给我发简历。这个词正在泄露发生的事情在卢卡斯影业。Ed 开始与 David 就建立卢卡斯影业需要的电影读者兼作家进行更深入的对话。电影仍然是电影的媒介,我们必须将我们的数字技术与它结合起来。
Ed 终于在 1980 年初给了我期待已久的电话,我加入了他在卢卡斯影业的行列。几周后,大卫接到了电话。我们三个和乔治的妻子玛西娅·卢卡斯共用一个办公室,在马林县圣安塞尔莫的一家小古董店楼上,从旧金山穿过金门大桥。Ed 正式任命我为计算机图形项目的主管,该项目是他管理的整个组织的计算机部门的一部分。大卫的电影录像机项目是计算机图形项目的一部分。
埃德和我开始通过雇佣来充实我们在卢卡斯影业世界的一部分。这并不难。每个人都想出演电影。例如,当我们第一次与斯坦福大学的安迪·穆勒(Andy Moorer)就数字音频项目的负责人进行接触时,他在我们进门时从椅子上跳了起来,我们还没说一句话,就向房间里宣布:“如果你来这里的原因是我认为你是,答案是肯定的!”
计算机图形项目的主要指定任务是用数字等效物代替光学胶片打印机。1980 年,光学打印机可能是好莱坞最不为人知的工具。但它对于特殊效果至关重要。这是第一次星球大战中合成图像的模拟方式电影。光学打印机将不同胶片条上的图像组合成一条胶片。例如,通过在蓝屏前移动物理模型来拍摄高速飞行的航天器。然后在光学打印机中,镜头的蓝色部分可以单独替换为星场镜头。或者可以将几个单独的航天器组合在一起,比如与小行星带一起,在一个星域上空。毫不奇怪,我们会使用 Alpha 通道以数字方式合成它们。David 的激光扫描打印机将成为我们将要建造的数字光学打印机的输入输出设备。
David DiFrancesco 将目光投向了可以读取和写入胶片的基于激光的胶片扫描仪。但以前没有人为 35 毫米电影彩色胶片制造过激光读写器。大卫谨慎地接近它,用相互竞争的激光技术制造了两个这样的设备,开始了他从艺术家和摩托车爱好者到激光扫描打印机和数字摄影科学专家的神奇转变。4
当然,我们在卢卡斯影业需要帧缓冲区。我很快与北卡罗来纳州 Ikonas Graphics Systems 的 Nick England 和 Mary Whitton 签约,为我们构建一个具有四个通道的帧缓冲区——这是第一个商业广告带有 alpha 通道的帧缓冲区作为标准设备。这就是 Tom Porter 的 RGBA 绘制程序的硬件基础——在第 6 章中让 Ravi Shankar 感到惊讶的样条曲线。5
亚历克斯·舒尔(Alex Schure)向旧金山南部发明录像带的公司 Ampex 出售了 NYIT 的绘画程序,这让我很沮丧。不是我复杂的 24 位程序 Paint3,而是更简单的 8 位版本 Paint。那里的一位年轻的受过斯坦福培训的编码员 Tom Porter 致力于将其改编为 Ampex Video Art (AVA) 产品。所以我聘请了汤姆,我第一个直接雇佣的计算机图形师,来编写卢卡斯影业的绘画程序。
绘图程序直接创建颜色像素,而不是从透视的三维计算机模型渲染它们的中心法则方法。Paint3 可以绘制比 Paint 更多的颜色。但更重要的是,因为它可以访问如此多的颜色,它可以将带有柔和边缘的笔画融合到帧缓冲区中已经存在的任何颜色中。结果,笔画和背景图像之间没有硬的锯齿状边缘,这种情况困扰着具有 8 位帧缓冲区且只有 256 种颜色可用的 Paint。
在卢卡斯影业,Tom 超越了 8 位 Paint 和 24 位 Paint3,编写了世界上第一个 RGBA 绘画程序。这个 RGBA 绘图程序也可以绘制一个 Alpha 通道。当您将带有柔和边缘的 24 位笔画绘制到帧缓冲区的颜色(RGB 或红色、绿色、蓝色)通道中时,您同时将每个像素的不透明度绘制到 alpha (A) 通道中。一旦 Paint3 绘制了笔画,它就永久地成为图像的一部分。但是 RGBA 笔画可以在其他背景上重复使用。这就是 Ravi Shankar 演示的样条形笔触如何放置在任意背景上并且可以重复使用。要完全控制数字图像,我们也必须能够完全控制其 Alpha 通道。具有 32 位像素的 RGBA 绘画就是这样一种重要的工具——在任何地方都结合了新的 Alpha 通道。
在 1980 年代初期在卢卡斯影业设计我们的数字光学打印机时,我们观察到我们可以制造一台比通用计算机快四倍的专用计算机。这是因为我们的数据是 RGBA 像素,这意味着我们可以同时在一个像素的所有四个通道上计算相同的东西。它将是一台专用计算机,只是因为它假设其数据是像素。否则它将是一台可以计算任何东西的通用计算机渠道。另一种说法是,我们的计算机将成为像素的通用计算机。这就是我们建造的。
四倍不是一个数量级,但它仍然是一个显着的加速。这台机器,后来被称为皮克斯图像计算机,是在我们等待摩尔定律正常提供给我们时获得额外计算能力的权宜之计。我不会在这里详述它,因为摩尔定律确实很快取代了它。然而,它确实在短时间内为我们提供了比任何其他计算机图形工具都多的功能。但是这个名字是从哪里来的呢?
有一天,我在一次汉堡午餐中向图形组中的四个人提议,我们以激光为灵感,并用一个看起来像西班牙语动词的名词来命名我们的机器。使用我的新墨西哥传统,我解释说西班牙语动词以-ir、-er或-ar结尾。我提出了pixer,to picture或to make pictures,发音为西班牙语“peeks Air”。四人之一的 Loren Carpenter 说:“你知道,Alvy,雷达这个词听起来很高科技。” 我跳了起来,“好吧,皮克斯也是一种有效的西班牙语形式。” 我发音为“peeks Ahr”。就是这样。这台机器有一个名字,一个看起来像(假的)西班牙语动词的名词,意思是拍照。我们很快将西班牙语发音改为“Pix ahr”。这个词,最初是卢卡斯影业机器的名称,在我们的未来中占有很高的地位,罗伦也是。
Loren Carpenter 发送了我在 JPL 的插曲中看到的最令人印象深刻的简历。他发送的并不是真正的简历。这是几张 8 x 10 的彩色照片,由计算机渲染的一座类似于西雅图雷尼尔山的山脉,位于他工作的波音公司附近。很明显,Loren 已经掌握了分形,这是一种用令人信服的自然细节对自然场景(如白雪覆盖的山)进行建模的新方法。洛伦是个很聪明的人。他知道他所要做的就是给我们看照片,我们就会知道他能做什么。的确,我们必须拥有他!
我立即取得了联系,但 Loren 拒绝进一步讨论任何事情,直到我看到他为即将于当年夏末(1980 年)举行的大型年度计算机图形会议 Siggraph 制作的计算机动画电影西雅图。当 Loren 终于放映他的短片Vol Libre时,Ed 和我坐在 Siggraph 电影展的前排。它以分形山脉为特色——茶壶埋在广阔的“自然”景观中——并把房子倒塌了。在他具有里程碑意义的演讲之后,我冲上舞台说:“现在?” 他说:“现在。” 我们立即为卢卡斯影业聘请了他。
分形是使用放大将计算机图形模型中的一个三角形变成数百万的一种绝妙方法。简单的想法如图 8.1 所示。唯一的最上面一行显示了我们作为微不足道的人类所采取的明确步骤:我们取三角形一侧的中点并在三个维度上将其位移一小部分。例如,我们可能会将中点抬高到原始三角形平面上方的距离与边长相比很小。类似地,我们置换另外两条边的中点。每种情况下的实际位移取随机方向和随机高度,新定位的中点用直线相互连接。换句话说,原来的三角形被替换为如图所示的四个较小的三角形,它们存在于三维空间而不是两个。这是第 1 步。
图 8.1
图片由皮克斯动画工作室提供。
我们的人类工作已经完成。计算机以其令人敬畏的放大功能接管,并将相同的技巧应用于步骤 1 刚刚创建的四个三角形中的每一个。结果是底行左侧的第一张图片。四个三角形变成十六个。这是第 2 步。然后计算机在第 2 步中创建的每个三角形上重复该技巧,以获得底行中的第二张图片。以此类推,直到我们原来的三角形开始看起来很像一座山。Amplification 仅用 5 个步骤将模型中的一个三角形替换为 1,024 个三角形。每一步对人类来说都变得越来越困难,但对计算机来说却毫无意义。在十个步骤中,这种分形山技术将我们一个微不足道的三角形变成了超过一百万个三角形。十五步将产生超过十亿个小三角形。几乎没有比工作中令人敬畏的放大更清晰的例子了。这也证明了我们是多么容易被复杂性所愚弄。
Loren 发给我的是用这种方式创建的分形山的照片。他把每个三角形都渲染成合适的颜色,看起来像一座由土褐色和树木繁茂的绿色覆盖的雪山。很明显,他掌握了分形技术。
我们现在知道如何制作山脉,但另一个问题是计算机图形表面似乎总是由塑料制成。查看第 10X步的 Phong 着色示例,大约在 1973 年(图 7.19)。球是闪亮的蓝色,带有清晰的白色亮点。它似乎是一个蓝色的塑料球。
那时人们对计算出来的图片应该是什么样子有先入之见。他们假设在计算机上创建的任何东西都必须看起来很僵硬、锯齿状或多面——总之,“计算机化”。随着这些问题特征中的每一个都得到解决,“计算机”的概念不断发展,塑料成为定义计算机图片外观的新标准。塑料具有肤浅或人工的社会意义,这无助于人们早期对计算机的认识。
但罗布·库克,唐·格林伯格在康奈尔大学的研究生之一,已经想出了如何将塑料留在身后。他的新技术产生了似乎由铜、木头或铝制成的渲染表面,而不是塑料。他将更多的物理学融入到计算机图形学中,即光与材料的相互作用。高光的颜色和形状是我们人类模拟什么材料的线索。无论是哑光还是光泽也很重要。这些都构成了计算机模型的外观因素。有了这个概念,阴影就具有了更大的意义。
我们也必须有这个人!所以我给罗伯打电话,给了他一份工作。他想知道他是否可以在康奈尔多呆一会儿,完成他的科学硕士学位。“这个提议是暂时的,”我说。他接受了。后来我得知,唐·格林伯格打算创办一家拥有罗伯才华横溢的公司。唐虽然很失望,但告诉我阻止罗伯加入卢卡斯影业令人兴奋的团队是不公平的。罗布最终确实完成了与唐的学位。
在卢卡斯影业,Rob Cook 的天才再次绽放。他用一种叫做阴影语言的新颖概念将阴影发挥到了极致。也就是说,他创建了一个用于讨论阴影的语法。向语言的飞跃始终是计算机科学的重大进步。仅次于库克的是纽约大学的肯·佩林(Ken Perlin),他的想法大致相同。6
图灵章节中描述的计算是一系列精心定义的步骤,这些步骤执行无意义的操作,例如将每个 1 交换为 0,反之亦然,或者将所有位向右移动一个位置。图灵自己通过引入子程序实现了语言概念的第一次飞跃:一个简短的无意义步骤列表一次又一次地被赋予一个名字;然后程序员可以将计算视为子程序名称的列表,而不是底层繁琐的指令。
我将子程序的概念比作将一本书分成章节,将章节分成段落,将段落分成单词。像这样使用层次结构让人类可以跟踪大量微小的无意义的步骤——或者写一本书的单词。这个级别的程序员通常知道无意义的步骤和子程序,就像作者知道单词和它们的单元组织一样。
向语言的下一次飞跃使我们人类完全无法了解潜在的无意义步骤。我们可以用对特定领域有意义的术语进行思考,例如着色或渲染的计算机图形。“术语”被实现为具有固定名称的子程序。但是由这些名称组成的语言的用户不必知道这些术语是如何实际实现的。他们只需要知道有人这样做是正确的。
考虑一下流行的文字处理程序 Microsoft Word,我用它来撰写这些页面。作为用户,您可以将键盘上的字符或菜单中的图标视为 Word 语言中的术语。您不必知道每个术语调用的计算机中一长串无意义的步骤。很少有人知道他们。考虑输入字母“A”。实际上,这样做会启动一长串步骤,在当前字体、当前大小、当前颜色、当前位置、当前页面上放置一个“A”,并导致字母的呈现出现在当前页面的屏幕显示上。如果您已将字母插入到已显示的句子中,则基本指令必须移动页面模型中的字母,以便为新的句子留出空间。键入“A”会导致很多事情发生,而您,用户,永远不必关心。您必须知道的是,在当前位置键入“A”会导致“A”出现在您想要的位置。相似地,剪切、复制和粘贴是 Word 语言中的术语,它们会在下面发生惊人的事情,而您却看不到。插入图片和插入超链接等术语也是如此。
随着摩尔定律将越来越多的领域带入计算领域,库克和佩林的着色语言概念遵循了计算机科学中已为人熟知的路径。这个想法是,通过创建正式捕获它的计算机语言来结晶一个领域。在 1980 年代中期,Cook 和 Perlin 将语言理念带入了广阔的未知领域:通过引入着色语言来推广着色。
到目前为止,我们已经考虑了一些着色技术:纹理映射、凹凸映射、Gouraud 着色、Phong 着色、透明度和材质外观因素。我们可以继续解释一种又一种这样的技术。但是 Cook 和 Perlin 真正的大想法是,任何计算都可以用来影响渲染表面的“阴影”。
假设我想要纹理贴图和凹凸贴图一个三角形。或者假设我希望它是带有凹凸的黄铜。或以上所有的组合。着色语言概括了着色的概念。可以用着色语言编写的着色程序数不胜数。这就是计算的本质——延展性的奇迹。
是时候了解使用 3D 几何图形描述的虚拟场景(以及精心指定的阴影)如何以彩色渲染成二维图片,例如数字电影的一帧。我们已经看到了如何渲染构成场景的三角形,但是这些渲染不是彩色的。并且只渲染了三角形的轮廓。
然后我们看到渲染的彩色三角形相对于像素间距很大。在这里,我们采用更实用的现代案例,数百个三角形小到可以落入像素位置之间的裂缝中。
让我们采用与以前相同的策略:我将向您展示每个像素的基本思想是多么简单。然后,我将使用 Epoch 2 Amplification 的魔力来处理为整个帧或最终为整部电影实现它实际上需要的大量计算。这部分是不人道的,但一旦你理解了基本的计算,就不难理解了。
所以,把自己想象成相机。眼睛固定在固定位置看世界。你从两个维度和透视中看世界。(为了明确起见,假设您闭上一只眼睛,所以只有一只眼睛是相机。)计算机图形学中的虚拟相机做同样的事情。它看到的“世界”是无形的几何图形。但它是经过仔细定义的,并且将其投影到透视的二维框架上的数学是很好理解的。
换句话说,我们知道的足够多,可以计算出在我们要渲染的场景模型中哪个三角形在另一个三角形前面。使用所有模型都是(可能是数百万个)三角形的集合的简化,这意味着我们可以计算渲染三角形的顺序。
我不会过于简单化。三角形的排序需要大量的计算工作,但最重要的是由我们忠实的计算机处理。我们真正需要了解的是,从虚拟相机中可以看出,确定两个三角形中的哪一个是前面的那个是相当简单的。相机可以看到哪些三角形?我们已经讨论了两种寻找可见表面的方法(许多可能的方法):深度缓冲和几何排序。
基本问题是将虚拟相机的世界视图渲染为一帧彩色像素,当它们显示时可以看到。这里有一个简单的方法来理解这个问题:想象一个窗纱将你的眼睛与可见的世界隔开。窗纱的电线将二维可见字分成小方块。再次警告:这些不是像素!作为该问题的第一个近似值,让我们假设这些微小的窗口屏幕视图中的每一个确实会在最终图像中产生一个像素。这种近似值在过去糟糕的日子里很常用,并且是造成像素是小正方形的错误观念的重要原因——即使在从业者中也是如此。
因此,渲染场景视图的问题已经简化为为每个窗口屏幕单元渲染一个像素的问题。哪一种颜色代表虚拟相机看到的落在那个小正方形中的所有三角形或三角形的一部分?
我在斯德哥尔摩市中心的老岛 Gamla Stan 一间美妙公寓的整洁厨房里写下这篇文章。我放眼世界,看到蓝色架子上的蓝白色盘子,另一个是香料,另一个是水杯,小煤气炉上方的黑色煎锅和器皿,干花,一排挂着的不锈钢刀,水槽旁边的洗碗器,等等。我的视野左侧有一个大窗口。一株盛开的白色天竺葵和其他植物填满了宽阔的窗台。外面,我看到一棵栗树,部分遮住了旧斯德哥尔摩的黄色建筑,再往前是积云的蓝天。
接下来我想象一个窗口屏幕将我与我刚才描述的场景分开。我的工作是只选择一种颜色来表示通过窗口屏幕网格的每个单元所看到的视觉场景。你可以想象一个四面的金字塔,它的顶点在我的眼睛,它通过窗纱正好在一个线栅处,并随着它向无穷远方向延伸而变宽。从我的眼睛看,一种颜色(!)必须代表落在那个小金字塔中的所有东西。
在某些情况下,这非常简单。例如,一些细胞只能看到远处的蓝天。那是他们像素的颜色。有些人只看到这个厨房的淡蓝色墙壁。那里的金字塔与隔壁的建筑物相交这一事实并不重要。墙壁是不透明的,因此厨房墙壁颜色隐藏了所有建筑物墙壁颜色。这些都是隐藏的表面。厨房墙壁颜色是这些像素的颜色。
通过成堆的盘子窥视的细胞更困难但更简单。我在看一堆嵌套的蓝白色汤碗。我眼中的小金字塔一次与几个碗相交,但它们是不透明的,因此只有通过窗纱单元直接可见的表面才能产生颜色。我这里需要的颜色将是蓝色和白色的加权组合,具体取决于每个窗口屏幕单元格的小金字塔相交的比例。其他的碗无所谓,碗外的蓝色架子墙无所谓,墙外的斯德哥尔摩老建筑无所谓,天外的天空也无所谓。虽然它们在小金字塔内,但它们都隐藏在我的视线之外。
搁置眼镜的架子比较困难。我的一些窗纱单元可以透过五层玻璃看到远处淡蓝色的架子墙,这意味着架子墙的蓝色被 10 块部分透明的玻璃墙修饰,将它与我隔开。
真正困难的案例是向窗外看的牢房。其中一些可以看到天竺葵植物、窗外部分打开的窗框、窗外的栗树,以及斯德哥尔摩建筑物或树外天空中的云,或两者兼而有之。但问题仍然存在:确定每个单元格的哪些表面是可见的,以及每个单元格按可见区域按比例贡献的颜色。然后为相应像素选择的最后一种颜色是这些颜色的平均值。在这种情况下,小金字塔与数十个甚至数百个表面相交,每个表面都可能为最终平均值贡献一点点颜色。
计算机图形学不会发生在漂亮的斯德哥尔摩厨房里。它发生在计算机内部。没有天竺葵或盘子,但可能有一棵树、一堆汤碗、一个装满玻璃的架子等等的几何模型。否则也是同样的问题。虚拟摄像机在每个窗口屏幕位置看到什么,那里的平均颜色是什么?
这是一幅自画像,描绘了艺术家在左手支撑的镜面球体中的倒影。埃舍尔的脸在中间,但可以看到他办公室的几何扭曲渲染。在那的背景是一扇窗户。当然,这是从至少 9300 万英里以外的地方聚集的光线。关键是,为了对一个像闪亮的球一样简单的物体进行忠实的 3-D 计算机图形渲染,理论上,你必须考虑到宇宙中的每个物体。
——尼尔·斯蒂芬森,秋季;或者,躲避地狱,2019 7
如果目标是模拟真实世界的光学器件,那么上一节的描述中就会缺少一些东西。想象一下,从您的眼睛中通过窗纱中的一个单元向外面的世界发出一束光线。眼睛不发射光线,但让我们表现得像他们在这个练习中所做的那样。这种虚假的“眼睛光线”是真实光线的反面,例如,从某个表面反射到我们的眼睛中。在前面,每条眼睛的光线都在进行直线进入世界,直到遇到不透明的表面,然后停下来。(把天空和云彩想象成无限远处的不透明平面。)如果眼睛光线穿过窗户或水玻璃,它会直接穿过窗户到达远处的任何表面。
图 8.2
© 2020 MC Escher 公司—荷兰。版权所有。
但是真正的光线会受到它们穿过的材料的影响。眼镜镜片就是一个明显的例子。它的全部目的是弯曲光线以更好地服务于我们的眼睛。通常,光线在穿过透明材料时会改变方向——它会折射。
考虑场景中的一面镜子。光线以与第一次遇到镜子时相同的角度从镜子表面反射。这通常是这样表述的:反射角等于入射角。
通常,光线会被真实世界的材料部分折射和部分反射。也就是说,一条光线在穿过世界的一个表面时会分裂成两条光线。
我在这里几乎没有暗示材料的复杂光学特性。在完整的中心法则现实主义中,假设由真实世界的材料制成的场景必须模拟这些实际的光学特性——从各个方向进入眼睛的光线,而不仅仅是直线。密切遵循这些属性的渲染器称为光线追踪器。
光线追踪自 1960 年代后期以某种形式出现,但在 1979 年,在传说中的新泽西州贝尔实验室的 Turner Whitted 的一篇论文中,它爆发出完整的计算机图形学之花。他的论文不是关于光线追踪本身,而是关于他所谓的“全局照明”——将现实的完整光学物理考虑在内。光线追踪是他认真对待中心法则的方法——摩尔定律支持他向“基于物理的渲染”迈进。在 1979 年的 Siggraph 会议上,特纳展示了震撼计算机图形界的图片(图 8.3)。事实上,这是他制作的动画中的一帧,由围绕玻璃球运行的华夫格球体制作,带有适当的阴影和扭曲。Turner 获得了 Siggraph 颁发的 2013 年 Coons 奖。8
带有或不带有光线追踪的中心法则渲染通常被描述为逼真的。光线追踪显然有助于提高照片写实感,但它也鼓励我们所谓的超写实主义——为了纯粹的乐趣而庆祝光学效果,而不是为了某种叙事目的。图 8.4 是“法国 3D 艺术家”Gilles Tran 的一个很好的例子。9
计算机图形渲染中最重要的技术之一被证明是猴子和人类使用的技术。它被称为随机采样(或分布式光线追踪),但我们必须小心随机的含义。图 8.5 是恒河猴眼睛如何对现实世界进行采样的图片。它来自 1983 年的《科学》杂志。白点是猴子视网膜中光感受器的位置。10
这表明大自然母亲没有使用均匀采样的网格来查看现实世界,而是使用嘈杂的网格。就好像像素位置从固定的网格位置略微随机偏移。(这里的重要信息——当我们专注于细节时不要忽视——是大自然母亲使用采样!)
图 8.3
特纳惠特,1979 年。
如果我们将随机“抖动”的网格理念与二次采样理念相结合,则会得到一个很好的近似值。图 8.6 显示了与单个像素(大点)相关的 4 x 4 子样本阵列,左侧没有随机距离的抖动,右侧有这种抖动。左边的模式在之前的二次抽样讨论中提出过(图 7.10)。将右侧的采样模式与刚刚呈现的猴子视网膜进行比较。用于子样本偏移的数学确保了一种有限的随机性,没有样本聚集或某些子样本未访问的大区域。
图 8.4
Gilles Tran,眼镜,2006。
数学表明,这种“猴子”解决方案用令人反感的噪声代替了令人反感的混叠(例如锯齿)。我们只是看不到低幅度噪声。没有可感知的模式。这种抖动的概念有很多应用,而不仅仅是在计算机图形学中。总的想法被称为蒙特卡洛方法(以摩纳哥著名的赌场命名),它正是用于模拟氢弹爆炸的蒙特卡洛方法,Eniac+(在我们的讲述中,它与第一台计算机与 Baby 并列) ) 作为它的第一个程序执行。11
考虑一下计算机图形解决方案的大胆:只有一种颜色最终会代表一个窗口屏幕单元内的视觉场景中可能存在的巨大复杂性。要了解这意味着什么,图 8.7 显示了 Pixar's Monsters, Inc. (2001) 中著名的毛茸茸角色 James P. “Sulley” Sullivan。(我们暂时离开严格的摩尔定律时间线来说明这一点——有关皮草的更多信息,请参见注释。)他的照片旁边是一个窗口屏幕的特写细胞对苏利皮毛的看法。(这里完全披露:怪物不是在这个非常高分辨率下计算的!这只是一个演示,如果它是在那个分辨率下计算的,底层毛皮模型会提供什么。)我们寻求的计算机图形解决方案是一种颜色(像素的位于大白点处)以实际使用的分辨率表示该毛茸茸的细胞的所有复杂性 - 左侧显示的 Sulley 的分辨率。这个想法是使用抖动二次采样,因为计算实际的平均颜色太难了。我们不必知道这个方形单元格中每个点所描绘的颜色。我们只需要知道 16 个随机选择的点的颜色。12
图 8.5
经 AAAS 许可。
图 8.6
图 8.7
概念和图片由 Thomas Porter 提供。©皮克斯。
让我们在继续之前重新审视那个小平方近似。我说一个像素的最终颜色是每个窗口屏幕单元格中可见颜色的平均值。换句话说,假设将使用盒式滤波器作为扩展器,从离散像素重建颜色连续体。盒式过滤器为每个子样本赋予相等的权重。但是我们从 Kotelnikov 的章节中知道,箱式滤波器是可用于采样理论的最差扩展器。
箱式过滤器远不及理想过滤器或理想的几个众所周知的近似值,如 Catmull-Rom 吊具或 B 样条吊具,它们的中间隆起和圆肩。这些不会对子样本进行同等加权,并且会考虑来自相邻像素周围区域的贡献。尽管如此,计算机图形学几十年来一直使用箱形滤波器作为粗略的近似,主要是因为摩尔定律直到最近才开始提供足够的计算能力来使用更好的采样和重建。随着摩尔定律的不断发展,现在才正在探索对几何定义世界的正确采样的更好近似以及更好的扩展器。提高图像质量始终是目标。13
在上面关于渲染电影的讨论中,我省略了一个非常重要的步骤。在电影和动画章节中,我们讨论了电影帧中的运动模糊如何成为我们大脑如何感知每秒投射的 24 个静止帧的运动的主要线索。我们很早就知道没有运动模糊的动画会失败——经典的失败是雷·哈里豪森在Jason and the Argonauts (1963) 中颤抖的骨骼,也在该章中讨论过。
尤其是 Ed Catmull,让我们纽约理工学院的其他人都能看到运动模糊的需求,他在 1970 年代中期开始研究一种在计算机动画中提供它的解决方案。后来在卢卡斯影业,他通过举办一场比赛来强调这个问题。他当然认为他会赢得比赛,因为他多年来一直在研究这个问题。令人惊讶的是,他没有赢,但他的领导力赢了。罗布·库克、洛伦·卡彭特和汤姆·波特——卢卡斯影业和后来皮克斯的天才三重威胁——解决了这个问题。
Rob 和 Loren 提出了空间抗锯齿的抖动二次采样方法。然后汤姆意识到同样的想法也可能及时奏效。它做了。一种技术解决了这两个问题。这个想法是将虚拟相机快门打开的时间细分为“子帧”。例如,假设要使用空间中的 4 x 4 抖动子样本阵列对每个正方形区域进行二次采样时间分为 16 个子帧,快门打开和快门关闭之间的 16 个时间片(图 8.8)。然后在单独的(时间)子帧中获取每个(空间)子样本,并在子帧占用的时间片内随机抖动。结果在空间和时间上进行平均,以使一种颜色代表运动模糊的单元格。前一个图像的 4 x 4 抖动空间子样本被推入时域,16 个子帧中的每一个,并在其子帧占据的时间片内进一步随机抖动。每条虚线都从“快门打开”子帧开始。对于第七和第十二子帧,详细显示了两个子样本的空间和时间坐标。为清楚起见,仅显示它们的两条虚线延伸到“快门关闭”子帧。
图 8.8
概念由皮克斯的 Thomas Porter 提供。
汤姆·波特 (Tom Porter) 为中心教条的突破性时刻创造了一幅令人惊叹的画面(图 8.9)。他自然而然地将其命名为1984 年,并于当年在 Siggraph 上首映。它不仅展示了抖动二次采样的使用解决运动模糊,也解决其他几个问题,比如软阴影。由库克、卡彭特和波特组成的令人惊叹的团队——我称他们为无产阶级——用一个绝妙的想法解决了许多问题。汤姆的标志性形象在 1984 年登上了Science84杂志的封面,标题为“这张照片是假的”。14
图 8.9
托马斯·波特,1984 年,1984 年,以及特写。©皮克斯。
这是完全荣耀的中央教条,除了一件事。台球中的反射并不是几何模型中三维物体光学精确光线追踪的结果。几何模型中没有窗户、台球运动员或棕榈树,也没有啤酒标志。相反,我们的美术动画师 John Lasseter 使用 Tom 的绘图程序绘制了它们。汤姆将它们贴图到场景中毫无特色的台球室墙壁上。因此,在从其中一堵墙反弹后撞击池球的光线从上面的纹理贴图中拾取颜色。
Porter's 1984使用随机采样技术进行光线追踪。这张照片介于令人愉悦的真实感和超真实感之间,那些手绘的台球室纹理贴图与完整的教条背道而驰。这些技术可以很好地帮助我们制作电影,而照片写实不是目标。
我们一直在 Lucasfilm 追求渲染路径。但与此同时,建模和动画路径必须并行发展。奇怪的是,他们的几个重要贡献者首先是 Unix 系统程序员,然后是计算机图形学家。这正如我之前提到的,当 Tom Duff 还在 NYIT 时,Unix-to-graphics 高速公路已经为我们带来了我们。汤姆在那里证明了自己既是图形专家又是系统专家。例如,他编写了一个用于渲染椭圆形物体的三维程序。他称它为Soid,并在 NYIT 用它制作了几部动画。我使用 Soid 来制作拍手(图 5.17)。
在 Ed Catmull、David DiFrancesco 和我离开 NYIT 前往 Lucasfilm 之后,Tom 是唯一一个仍然在 NYIT 的人,他弄清楚了他必须做些什么才能被包括在内。由于亚历克斯舒尔的暴虐倾向,埃德非常小心,没有偷猎,但当汤姆宣布他离开纽约理工学院时,他迅速采取行动。Lucasfilm 也将成为 Unix 商店,需要 Unix 专家。但更重要的是,汤姆将在卢卡斯影业创建关键的 3D 建模程序。他成为计算机图形项目的一部分。15
另一位 Unix 专家兼计算机图形学专家比尔·里夫斯(Bill Reeves)以一种惊人的平行方式——与多伦多大学罗恩·贝克尔(Ron Baecker)小组的加拿大人汤姆·达夫(Tom Duff)一样——将为卢卡斯影业编写关键的动画程序。Ed 聘请他是因为他在 Unix 方面的专业知识,但 Bill 很快就进入了计算机图形组,在那里他将发挥重要作用。Siggraph 2018 表彰比尔对该领域的全面影响,使他成为新的从业者奖的第一位获得者。
另一位杰出的程序员(虽然不是加拿大人),Eben Ostby,后来加入了卢卡斯影业,沿着 Unix 到图形的道路前进。在比尔聘请他加入我们的系统组之前,埃本曾在传说中的贝尔实验室任职。Eben 很快就证明了自己也擅长建模、动画和渲染软件。
比尔和埃本将成为皮克斯的 40 名创始员工之一。奇怪的是,汤姆达夫不会。他在皮克斯开始之前就离开了卢卡斯影业,只是在成立后重新加入我们,并在 . . . 除了贝尔实验室,还有其他地方。
有些东西不能方便地用几何建模。比尔·里夫斯对数字光的主要贡献之一是他称之为粒子系统的东西。考虑云、火和水。或者烟花、星星和烟雾。它们是模糊的物体。1982 年,在卢卡斯影业,比尔提出了使用许多微小粒子的集合来模拟模糊物体的概念。把每个粒子想象成一个小但非零大小的点。粒子系统随着时间的变化,系统中的粒子诞生到系统中,在系统内移动或变化,然后从系统中消亡。每个粒子都有一个生命周期,在此期间它遵循一个轨迹。它可能具有某些特征,例如颜色、透明度或大小,这些特征可能会在其生命周期内发生变化。粒子根据需要随机移动或变化模糊对象建模。在每个时刻,活粒子都被渲染成图像。16
比尔对他的新技术的第一个应用是火。每个粒子都有一种颜色,通常是红色,但有些是随机的绿色。每个人在平坦的表面上都有一个随机位置,并从那里以随机方向向上射击。一个粒子的轨迹是由一个想象的引力场决定的,所以它会弧形回到地面。每个都有一个随机的初始大小和透明度。每个粒子都是运动模糊的。也就是说,在每一帧中,都会计算粒子沿其轨迹的开始和停止位置,通常是一小段距离。粒子将在渲染时沿着该路径涂抹。
这个粒子系统模型在每一步的渲染都是通过在单个帧中渲染每个粒子的开始和停止位置之间的抗锯齿直线来完成的。回想一下,Malcolm Blanchard 在 1976 年左右在 NYIT 引入了抗锯齿(无锯齿)线段,而 Dick Shoup 在此之前于 1973 年在 Xerox PARC 渲染了它们。因此,边缘柔和、通常为红色的短线段将实现粒子的拖尾沿着它的运动路径。线段的颜色只是在帧缓冲区中添加在一起。由于少数随机分配的绿色,这些添加导致火的中心在从地表爆炸时发出炽热的橙黄色光芒。然后随着粒子的消亡,它们会趋向于大部分是红色的,并且似乎正在冷却。
汤姆·达夫、比尔·里维斯、罗伯·库克、罗伦·卡彭特、汤姆·波特。我们在卢卡斯影业组建了一支由计算机图形明星组成的世界级团队。Jim Blinn 从 JPL 加入我们,但就像他之前在 NYIT 所做的一样,Jim 在他自己独特的编程世界之外感到不舒服,于是回到了 JPL。我们将来自 JPL 的 Jim 团队的 Pat Cole(另一位具有开创性的早期女性)加入了该小组。17
我们假设乔治卢卡斯会在任何一天敲我们的门,要求为他的一部电影提供计算机图形内容。但他从来没有来过。终于,我恍然大悟。乔治卢卡斯不知道他有什么!他犯了一个典型的错误,认为我们只是一群做硬件和软件的“技术人员”,而他和他的团队是制作电影内容的“创意人”。我以为我们已经明确表示我们也是内容创建者,但信息并没有被采纳。
派拉蒙影业公司让卢卡斯了解我们的能力。为了我们的下一次幸运休息,派拉蒙与卢卡斯影业的特效部门 Industrial Light & Magic (ILM) 接洽,为《星际迷航 II:可汗之怒》(1982)工作。派拉蒙的人想要星际迷航 II中的一些计算机图形,但工业光魔没有计算机图形学。ILM 告诉他们,“隔壁”的新人做到了。就在那时他们叫我进来。
我听过派拉蒙的人描述他们在电影中想要什么。它将解释一种称为“创世纪效应”的关键叙事手段,它可以瞬间将死亡转化为生命。他们提出的想法是漂浮在水族馆中的一块岩石,不知何故,会被绿色苔藓覆盖。我不解地看着他们说:“你知道我们现在可以用计算机图形做什么,不能做什么吗?” 他们承认他们没有。所以我建议我离开一天,然后带着一个可以满足他们叙事需求的镜头建议返回,并且成为我们在 1980 年代初期实际上可以经济高效地计算的东西。他们同意了。但后来我想起了一个关键问题。“我们还不能做电影分辨率。我们只能做视频分辨率。” “这不是问题!这是应该的成为柯克上将的视频演示。”
我走出那个房间,离地面大约十英尺。就是这样!我们刚刚获得了重大突破!终于有机会上大银幕了!我们刚刚被要求自己制作一个完整的镜头!在一部注定要成功的主要电影中。
我整晚都在设计镜头。它将使用——它必须使用——我们组装的计算机图形神童团队的所有才能,它必须解释创世纪效应。我画了一个故事板,讲述了后来被称为 Genesis Demo 的故事。它仅由六块原始面板组成,这些面板是在我当时广泛使用的绿色工程垫纸上绘制的。就在我将它呈现给 ILM 和派拉蒙之前,我认为使用标准的 ILM 故事板格式来修饰故事板是一个好主意。图 8.10 显示了我为提议的镜头绘制的最终版本中的两个清理后的故事板面板。
吉姆·布林 (Jim Blinn) 在喷气推进实验室 (JPL) 的航海者号宇宙飞船行星飞行是主要灵感来源。我故事板中的(看不见的)宇宙飞船环绕着一颗满是陨石坑的死去的类似月球的行星。Loren Carpenter 将设计星域和航天器轨迹。汤姆达夫会用凹凸贴图制作陨石坑。帕特科尔将模拟从航天器向死亡星球发射的射弹。弹丸的影响引发了一场大火。Bill Reeves 将使用他的新粒子系统来实现火灾。一堵火墙戏剧性地吞没了这颗行星并融化了它的表面。从熔融表面出现分形山脉,洛伦将使用前面描述的分形技术制作。大海会形成,山会变凉变绿。随着航天器的加速,这颗死去的行星将被重新揭示为活的和地球一样的。Tom Porter 将通过他的绘画程序和纹理映射来监督最后一部分。创世效应不会如所希望的那样瞬间发生,但只需一分钟就能解释清楚。18
图 8.10
图片由皮克斯动画工作室提供。
尽管故事板很粗糙,我们还是得到了这份工作。我把团队召集到一个房间里,宣布:“我们刚刚取得了重大突破”,并告诉他们我们将做一项一流的工作——满足派拉蒙的叙事需求并取悦《星际迷航》的观众。然后我的主要信息是:“但这个镜头的真正意义是,给乔治卢卡斯一个 60 秒的广告,这样他就会知道他得到了什么。”
我知道乔治的一个秘密,并打算利用它:当他看电影时,他会时刻注意摄像机和摄影师的决定。他不会被这种情绪所吸引。如果你仔细想想,一个不能让你沉浸在他或她的电影情感中的导演是失败的。尽管如此,乔治卢卡斯可以避免情绪并跟踪相机,或者两者兼而有之。我向小组解释了这一点。“所以我们要在这个镜头中加入一个真正的相机不可能做到的镜头移动。不会是无偿的。它将具有完美的叙事意义。但这会让乔治大吃一惊。”
这就是我们继续做的事情。Loren Carpenter 通过数十只鸭子设计了一个复杂的多维样条曲线来描述相机的移动。这是形状章节中介绍的样条线概念的另一种用法。在这里,样条曲线在四维时空(空间三,时间一)中插值了相机的位置和方向。摄像机注视着正在逼近的死亡星球,旋转以跟踪星球表面的动作,停留在移动的火墙前方,凝视下方快速生长的山脉,然后回头看现在还活着的绿色星球,随着我们的宇宙飞船加速离开,完成它的行星飞行。图 8.11 是几个 Genesis Demo 元素的组合。
图 8.11
图片由皮克斯动画工作室提供。
在《星际迷航 II:可汗之怒》 (1982 年)首映后的第二天,乔治·卢卡斯在我看来是一个相当害羞的人,一只脚走进了我的办公室。“很棒的相机动作!” 他说。然后他就走了。他明白了!在他的下一部电影《绝地归来》(1983 年)中,他加入了我们小组的汤姆·达夫和比尔·里夫斯创作的短片。而且,重要的是,他一定告诉了他的好朋友史蒂文·斯皮尔伯格关于我们的事。斯皮尔伯格将卢卡斯影业的计算机图形学纳入他的《年轻的夏洛克·福尔摩斯》(1985 年)。有一种新方法可以制作引人入胜的电影内容的消息开始传播开来。终结者2:审判日(1991) 计算机生成的光栅图像已进入好莱坞技术领域。我们朝着我们的目标迈出了重要的一步——成为皮克斯团队的第一个团队努力。
但 1982 年的 Genesis Demo 并不是电影。电影仍然需要千禧年的大数字融合,但工作正在进行中。星际迷航 II是该团队的早期锻炼,最终成为皮克斯并创建了玩具总动员(1995)。我们为 Genesis Demo 感到自豪,但这只是特效。在那个领域,我们是远非孤单。Tron是 1982 年跟随Trek仅一个月的狂热宠儿,最能说明这一点。Tron为演变成 Blue Sky 并制作Ice Age (2002)的团队提供了相同的功能。
从 1980 年到 1985 年,摩尔定律 1000X步见证了许多公司的诞生,这些公司准备好提供数字特效以供出租。迪士尼使用其中四个来制作Tron:加利福尼亚的 Robert Abel and Associates 和 Triple-I(信息国际公司),以及纽约的 Digital Effects 和 MAGI(数学应用集团公司)。其中两个在这里持续受到关注:好莱坞附近的 Triple-I 是小约翰·惠特尼和加里·德莫斯的故乡,卢卡斯影业作为电影竞赛中的重要竞争对手,我们非常关注。正如我刚才提到的,正是 MAGI,后来出现了 Blue Sky 集团。注释列出了这个形成时代的许多其他公司。
导演 Steven Lisberger 在前Xerox PARC 的 Alan Kay 的建议下,将Tron的概念带到了迪士尼——他将观点等同于 80 点的智商。Lisberger 出身于经典的角色动画背景,但在 Kay 的坚持下,他将电脑动画推广到了迪士尼。但不是电脑角色动画。Tron中的所有角色都是由红色或蓝色霓虹管组成的真人演员。这使它们看起来像发光的卡通人物,但这实际上是模拟后期制作过程的结果。这个项目对迪士尼来说是不寻常的,这家公司通常不会向外寻求帮助。值得称赞的是,沃尔特·迪斯尼的女婿罗恩·米勒 (Ron Miller) 是迪斯尼的高管,他给了Tron继续。19
其计算机效果动画的数字制作是后勤方面的噩梦。它需要整合来自东海岸和西海岸的四家公司的工作,具有四种不同的外观和四种不同的硬件和软件基础。他们一起设法制作了 15 分钟左右的计算机图形,并被纳入最终电影。这种关于大量屏幕时间的说法很难评估,因为它肯定包括由 Digital Effects 贡献的 Bit 的所有外观。Bit 是一个很小的多面体“字符”,只能以蓝色和黄色两种交替颜色存在,并且占用的屏幕空间很小。20
最令人难忘的Tron计算机图形是 MAGI 在纽约威彻斯特县制作的“光周期”序列(图 8.12)。整个场景长约三分钟,包括至少约一分钟的插播真人镜头。重要的是,光循环序列给当时在迪士尼工作的年轻动画师约翰·拉塞特留下了深刻印象:“这绝对让我大吃一惊!脑海中的一扇小门打开了。我看着它说,‘就是这个!这就是未来!’”后来,他加入皮克斯后,要说,“没有创战,就没有玩具总动员。” 21
图 8.12
Mathematical Applications Group Inc. 成立于 1966 年,使用蒙特卡罗射线追踪评估核辐射。该公司很快意识到他们可以用他们的技术模拟光线,而不仅仅是核辐射。1972 年,他们创建了一个名为 MAGI/SynthaVision 的计算机图形部门,以利用这一概念并制作早期的电视广告。因此,MAGI 一直使用光线追踪作为其渲染技术,这使其与其他公司区别开来。从上图中的光周期来看,到 1981 年,当迪斯尼聘请他们制作Tron效果时,他们还没有利用光线追踪的超真实感。MAGI 聘请 Chris Wedge 作为Tron (1982) 序列的动画师,这一决定对数字电影的未来非常重要。22
1983 年,迪斯尼与 MAGI 签订合同,根据莫里斯·森达克 (Maurice Sendak) 广受欢迎的儿童读物《荒野之地》( Where the Wild Things Are ) 制作一部测试电影,历史潮流再次交织在一起。Wild Things 测试的概念是角色 Max 和他的狗将按照传统方式使用二维 cel 动画创建,但在三维计算机图形背景上。MAGI 的 Chris Wedge 和其他人制作了 3D 线框背景。迪斯尼动画师约翰·拉塞特和格伦·基恩为这些背景手工制作了动画。因此,两位对数字电影的未来如此重要的动画师克里斯·韦奇和约翰·拉塞特首次相互接触,并与数字好莱坞接触。23
正如本章的流程图所示,有三个地点直接通向了在千禧年制作第一部数字电影的三个工作室。MAGI 于 1972 年通过其 SynthaVision 部门进入该行业。NYIT 于 1974 年开始了它的计算机动画实验室,实验室。第三个地点是加利福尼亚的太平洋数据图像 (PDI)。
Carl Rosendahl 从他父亲那里借了 25,000 美元,并于 1980 年创办了 PDI,将计算机图形商业化。1980 年,我和 Ed Catmull、David DiFrancesco 刚刚在卢卡斯影业的玛西娅·卢卡斯的办公室里开了一家店。我们只是一个研究小组,根本不是自给自足的。我们甚至没有想到我们可以支持自己做计算机图形。
1982 年 3 月,Richard Chuang 和 Glenn Entis 加入 Rosendahl,成为动画公司 PDI 的三位联合创始人。后两人编写了 PDI 的动画软件,他们三人在 1994 年获得了 PDI 动画系统技术学院奖。
Chuang 从 Ed Catmull 和我们其他人在 Lucasfilm 教授的课程视频中学习了计算机图形学。Entis 作为布鲁克林的一名计算机科学专业学生和曼哈顿的一名程序员,曾在附近的纽约理工学院学习计算机图形学——在 1970 年代后期,纽约理工学院的 Ed 和我们其他人教授的课程中。当我聘请汤姆加入卢卡斯影业时,Entis 接替了汤姆波特的 Ampex 的 AVA 项目。24
我们比其他计算机图形公司更密切地跟踪 PDI 的商业进展,因为正如同事 Loren Carpenter 所说,它“做正确的图形”。对于初学者来说,它们是一个 Unix 公司,用 C 语言编写。但在我们看来,PDI 还没有成为 The Movie 的竞争对手。MAGI 也没有——还没有。这份名单上只有一家公司,Digital Productions。
小约翰·惠特尼 (John Whitney Jr.) 和加里·德莫斯 (Gary Demos) 在 Triple-I 工作时,迪斯尼与它签订了Tron特效合同,这是四家此类公司之一。但两人很快就该项目所需的计算能力数量与管理层产生了分歧。他们于 1981 年离开 Triple-I,并于 1982 年在 Ivan Sutherland 的投资下开始了 Digital Productions。25
早在 1974 年,Sutherland 就曾试图与 Glen Fleck 一起创办 The Picture/Design Group 并进入好莱坞市场,但没有成功。Ed Catmull 一直在等待公司成立,直到他年轻的家人的要求迫使他在其他地方寻找工作。另一个年轻人 Gary Demos 也打算成为 Sutherland 公司的一员,可能还有来自才华横溢的惠特尼家族的 John Whitney Jr.。约翰(Jr.) 和 Gary 似乎是我们熟悉电影的计算机图形领域的固定装置。
埃德和我仔细追踪了他们。他们的不寻常之处在于他们使用非常强大的计算机进行计算并以非常高的分辨率拍摄。他们位于好莱坞附近,并与电影业的推动者和震动者联系在一起。1981 年,在弗朗西斯·科波拉 (Francis Coppola) 为《心之一》( One from the Heart ) (1982 年)的舞台上的一次午餐会上,我坐在一张大桌子对面,坐在约翰和女演员泰瑞·加尔的对面。当我意识到他们一起长大并且显然是老朋友时,我的心沉了下来。从外面来,我们还有机会吗?约翰和加里会在电影中击败我们吗?
我们认为他们可能有充分的理由。他们已经参与了几部故事片。在 Triple-I,约翰为米高梅的《西部世界》(1973 年)贡献了数字图像处理场景,获得了财务上的成功。然后,他和加里在《未来世界》(1976 年)中用三维阴影图形渲染了演员彼得·方达的头部,这是一部不太成功的西部世界续集。我们对未来世界特别熟悉,因为它包括另外两个 3D 阴影光栅图形——Ed Catmull 的手和 Fred Parke 的脸(图 7.13),这是他们在 1970 年代初在犹他大学创建的灰度动画。26
约翰和加里随后在 Triple-I 制作了Looker (1981),这部电影以女演员苏珊戴伊全身扫描的三维渲染为特色。一个非凡的巧合是,Looker的故事涉及整形外科医生拉里·罗伯茨博士,他对追求身体完美的超级名模进行了微小的改造。编写剧本的迈克尔·克莱顿(Michael Crichton)可能没有意识到另一位拉里·罗伯茨(Larry Roberts)博士(他是 1963 年在麻省理工学院的三巨头)在完善透视(计算机)模型显示方面的开创性作用。但Looker只包含一点计算机图形。这也是财务上的失败。27
但是,当 Ed 和我认为比赛结束的那一天终于到来了。计算机图形学的小世界里闪过消息:约翰和加里购买了一台克雷超级计算机!我们的 Cray 推销员 Bence Gerber 几年来一直试图在卢卡斯影业向我们出售价值数百万美元的 Cray,但我们无法理解这样的购买,也无法证明其成本合理。Cray 超级计算机与我们打算做的不太匹配。或者我们是这么想的,直到我们听说购买了 Digital Productions。埃德和我拿出众所周知的信封,再次进行计算。我们是不是哪里出错了?答案再次是否定的。购买只是没有经济意义。
PDI 的联合创始人 Richard Chuang 几乎以同样的方式记住了当时的情况:
我永远不会忘记 Digital Productions 宣布他们获得 Cray 的那一天。起初它是令人震惊的。哇,这个行业就这样了——他们买得起克雷——没有人能与之竞争。但那天晚些时候——我永远不会忘记——我、卡尔和格伦坐在地板上,讨论我们永远买不起克雷参加比赛,但一个小时后,我做了数学计算,回来说,等一下——这些人永远不会持久,他们负担不起——如果你有任何商业意识,你就会知道成本/价值主张——你可以计算出来。Cray 的投资回报并不能证明我们从事的业务是合理的。28
约翰和加里进行了一场巨大的赌注——押注好莱坞的工作室会使用 Cray,如果他们可以使用的话,从而将成本分摊给几个有钱的用户。但那并没有发生。Cray 是一个错误,它注定了当时唯一真正让我们感到害怕的竞争对手。Digital Productions 在The Last Starfighter (1984) 中做出了崇高的努力,使用了 Cray,但他们 12 分钟的 3D 贡献远不能成为一部完整的电影。Digital Productions 于 1986 年因所有实际目的而停止存在,也就是皮克斯成立的那一年,被另一家制作公司以敌意收购的方式收购。29
直到后来我们才知道卢卡斯影业曾考虑与约翰和加里一起去,而是选择了我们。1978 年,还在 Triple-I 工作时,他们向卢卡斯影业提交了一部关于星球大战(1977)中美丽的 X 翼战斗机的电影测试,以三维建模并以非常高分辨率渲染。但他们没有对 X 翼的锋利边缘进行抗锯齿处理。他们认为高分辨率会使这些边缘的锯齿变得太小而无法看到。但事实并非如此。理查德·埃德伦德(Richard Edlund),同样是卢卡斯影业的特效大师,他带着他的《星球大战》大皮带扣在纽约理工学院拜访了我们,他立即发现了锯齿,并且无法容忍它们。
尽管我们以低得多的分辨率进行渲染——因为这是我们可以合理负担的全部——但我们非常努力地对所有边缘进行抗锯齿处理。从一开始,“No Jaggies”就是我们卢卡斯影业的座右铭。这是关键的区别。事实上,我们在空间和时间上消除数字电影中的采样伪影将是我们成功的“秘诀”之一。图 8.13(左)中的照片显示了早期在卢卡斯影业的 Ed 和我(从左到右)与卢卡斯影业最早的计算机图形天才之一,我们的分形专家 Loren Carpenter。我穿着我们每个人都有的“No Jaggies” T 恤,它的标志在图 8.13(右)中显示得更清楚。
我们将 Digital Productions 视为我们的竞争对手是错误的吗?约翰和加里从未说过他们打算制作一部数字电影。他们的作品几乎都是其他电影的特效作品。但是有一个领域他们直接与我们竞争,或者我们是这么认为的。当我们向迪士尼提出计算机动画制作系统 (CAPS) 时——正如我在电影和动画章节中所描述的——迪士尼工作人员告诉我们,数字制作也在考虑之中。这强烈暗示了对角色动画的兴趣。无论对错,约翰和加里都赢得了我们的尊重。他们很聪明,准备好大展拳脚。多年后,在 1990 年代后期,当 Gary 在华盛顿特区寻求我的帮助以争取改变 HDTV 数字电视标准时,我很高兴能加入他的行列。
图 8.13
(左)图片由皮克斯动画工作室提供。(右)Craig Reynolds 的概念。
Digital Productions 在The Last Starfighter中的作品令人印象深刻,但它没有数字角色。我们想做角色动画。但是我们缺少了一些必不可少的东西——一个角色动画师——一个有着难以形容的能力来激发草图线条或渲染三角形的人。
一位伟大的动画师实际上访问了卢卡斯影业。1980 年,当我们还在圣安塞尔莫的古董店楼上与玛西娅·卢卡斯共用一个办公室时,布拉德·伯德曾看过我们。他想和我们一起拍一部动画电影。他是我见过的最有趣的人(现在仍然是)。当我们走在圣安塞尔莫的街道上聊天时,他让我不停地缝针。但我知道他对艺术太敏感了,无法忍受当时电脑的恶劣环境。他们很吵,需要寒冷的空调,而且经常失败。而且他们的速度慢得令人发指。
但仅仅几年后,我们得到了第二次机会。我们现在有足够的工具,终于有了足够的摩尔定律支持的计算,但我们缺少动画师。然后我和 Ed Catmull 遇到了制作电影所需的人:约翰·拉塞特。我们在一年一度的迪斯尼朝圣期间遇到了他,继续在我们加入卢卡斯影业之后。与纽约理工学院的大多数动画师不同,约翰一点也不害怕我们。约翰很兴奋。他已经与 MAGI 一起为Where the Wild Things Are进行了一个简短的测试。他见过特隆。他已经对使用计算机工作的感觉有所了解。
根据 Ed 和我的记录,我们实际上早先见过 John,第一次是 1983 年 2 月 16 日在卢卡斯影业,然后是 5 月 11 日,但当时他并没有给我们留下深刻的印象。这是在迪斯尼与他的第三次相遇,他的名字令人难忘。他把我们带到了迪斯尼档案馆,问我们想看什么。我口中的第一句话是,“普雷斯顿·布莱尔在幻想曲中跳舞的河马。” 他继续向我们展示了布莱尔的原画!他像动画师那样用拇指在布莱尔的床单边缘拍打。. . 河马风信子翩翩起舞!这对我来说是一个强大而神奇的时刻。接下来,我要求看《小飞象》中粉红色的大象场景,约翰继续答应了。我感觉到我们当时和那里的联系。30
但艾德和我不能碰约翰。他在迪斯尼工作。尽管如此,他还是给我们留下了深刻的印象。尽管他很年轻,但他曾两次在迪斯尼加州艺术学院的角色动画学校(沃尔特创立的学校)中获得“学生奥斯卡奖”最佳动画奖。
在从 1983 年的 Siggraph 回来的飞机上,我和 Ed 决定在 1984 年的下一次Siggraph 上,我们将向全世界宣布我们制作了角色动画。那将是我们的差异化因素。还在飞机上时,我再次在绿色的工程垫纸上勾勒出故事板的草图,我最初称之为我和安德烈的早餐,以向我们中的一些人特别欣赏的电影致敬,我和安德烈的晚餐(1981),由安德烈格雷戈里(André Gregory)主演(扮演安德烈)和华莱士肖恩(扮演沃利)。
所以在我们的动画中,一个名叫安德烈的机器人会醒来,站起来,并大力伸展。太阳将升起,展现出丰富而美丽的自然景观。角色动画来了!这不是一个好故事,但我还看不到。
幸运的是,几个月后,埃德正在参加一个关于旧玛丽皇后号的会议,该会议永久停靠在长滩作为会议场所。我们正在打电话,每天都有业务更新电话,当 Ed 让我吃惊时说:“我刚看到 John Lasseter。他已经不在迪士尼了。” “现在就挂断电话,”我喊道,“去雇他!” 当然,Ed 知道这是一个绝妙的主意,并且确实做到了。31
只有一个捕获。乔治卢卡斯曾告诉埃德,计算机图形团队无法制作角色动画。他坚持说,只有迪士尼能做到这一点。所以我们在 1983 年末聘请了 John 作为“用户界面设计师”,而不是“动画师”,以使他远离 George 的视线。多年来,我们都不知道迪斯尼解雇了约翰,因为他想从事电脑动画。
约翰对我的早餐与安德烈故事板的回应是,“我可以提出一些建议吗?” “当然,这就是你来这里的原因!” 他继续保存这个项目。首先,他将机器人软化为更圆润、更可爱的安德烈。Ed 为他设计了一个更具延展性的身体,一个泪珠形状。它比球体的集合灵活得多。然后约翰建议添加另一个角色,一只大黄蜂。Ed的泪珠变成了它的腿。为了完成对我与安德烈共进晚餐的致敬,蜜蜂必须被命名为沃利,以纪念华莱士肖恩。事实上,他变成了 Wally B。我们将标题改为André & Wally B 历险记。这将是 John 与现在被称为 Pixar 的团队的第一次郊游,也是我作为导演的第二次尝试。
在约翰到来之前,我真的以为我会成为这部作品的动画师。毕竟,我做了那些美味的拍手。我还不了解一个真正的角色动画师必须具备的令人敬畏的才能,而我绝对没有。我可以让三角形移动,但我不能让它们有表情。我无法激励他们。我可以拍手,但我无法说服你它们属于有意识的存在。约翰可以做到这一切,而且他轻松自然地做到了。
到 1984 年在明尼阿波利斯举行的 Siggraph 之前,团队并没有完全完成André & Wally B.,但 Siggraph 官员还是允许我们展示它。没有什么比拥有数以千计的同龄人更甜蜜的了,他们确切地了解您的成就,为您的工作大喊大叫、跺脚和欢呼。现在我们从事角色动画业务,响亮而清晰,所有旗帜都在飘扬。
André & Wally B.显然是艺术上的突破,人们也是这样接受的。移动的不仅仅是人形物体。是两个角色情绪化。他们纵容了!还有一个故事。这很简单,也有点刻薄——一只巨大的蜜蜂威胁小男孩安德烈,他试图转移蜜蜂的注意力;有追逐;巨大的蜜蜂从小男孩身上蜇出贝耶苏斯——但这是一个故事。分蘖处有一位专业的角色动画师。
这也是一项技术突破。它表明我们拥有足够复杂的建模、动画、渲染和电影录制程序,可以将 3D 角色的梦想带到电影屏幕上。它具有两项特定的技术进步。
Bill Reeves 修改了他的粒子系统想法,该想法产生了 Genesis 演示中的行星融化火焰。将火粒子变为绿色,并在其遵循轨迹时留下渲染路径,然后您会得到 . . . 草。他还设计了他的系统的树生成版本,该系统创建了粒子云,如树叶,附着在树干和树枝上——落叶树为黄色和橙色,常绿树为深绿色。与分形一样,一些简单的计算重复了数百万次,将一个简单的数据库放大为一个令人满意的复杂“自然”森林。第一个。
图 8.14
©皮克斯。
最重要的是,André & Wally B.向 1984 年的 Siggraph 世界证明我们已经解决了运动模糊问题。Wally B. 的翅膀模糊了。安德烈的迅速离开使他陷入了困境。Cray 公司借给我们时间在他们的一台超级计算机上完成 Siggraph 的电影(也许最终吸引我们作为客户)。图 8.14 显示了四个连续的帧。根据在 Cray 监督计算的 Loren Carpenter 的说法,第三帧中的计算数量如此之多,以至于“让 Cray 崩溃了”。他决定没有人会注意到涂片不完整,并接受了不完整的框架。没有人注意到。
George Lucas 参加了André & Wally B.的首次放映,这让我们非常惊讶和高兴。他真的在城里看 Linda Ronstadt 的表演,但他也参加了我们的 Siggraph 首映式。卢卡斯终于要看看我们能做什么了!在一大群几乎可以肯定是热情的观众面前。多年后,当我从迈克尔鲁宾那里得知卢卡斯讨厌这部作品时,他正在研究他关于卢卡斯电影时代的书Droidmaker 。幸运的是,他没有这么说。它会伤透我们的心。
尽管在 Cray 超级计算机上使用了一段时间,但这件作品并不完整。一个场景仍然有线框前景字符,尽管在 Siggraph 看过它的人几乎没有人记得它们。另一方面,它并不像后来的拉塞特动画那样精致。这是他第一次使用 3D 动画模型拍摄完全由计算机生成的作品。在 Siggraph 观众中,几乎所有其他人,数以千计的人,都对已经取得的巨大进步表示赞赏,并且可以预见未来。但卢卡斯显然只能看到当时直接摆在他面前的东西。所以这是另一个案例,一个与我们不同的人无意中帮助我们实现了我们的。我们帮助他实现了他对数字化电影制作的清晰而重要的愿景。此外,几年后,他确实做出了改变。星球大战电影。
John Lasseter 和 Bill Reeves 在André 和 Wally B的制作过程中首次组成了他们的紧密组合。John 是合作的艺术创意成员,而 Bill 是技术创意成员。一个没有另一个就无法成功。
我很自豪我们在卢卡斯影业创造的环境,后来被带到皮克斯,不允许有害的技术与创意错误。我们在技术创意和艺术创意人士之间建立了一个相互钦佩的社会,在声望、薪水、晋升、福利,最重要的是尊严和尊重方面平等。
一个鲜为人知的“几乎”发生在我们在卢卡斯影业的最后几年。尽管乔治卢卡斯反对制作电脑动画电影,但我们几乎与一家日本公司合作制作了第一部《电影》。32
1984 年,代表日本大型印刷公司 Shogakukan(“Show gah khan”)的继承人的人向我们提出了一个宏伟的想法:制作第一部数字电影,并以日本儿童喜爱的淘气的孙悟空为基础——事实上,亚洲的大多数儿童。我认为这是一个神奇的概念,因为猴子多年来一直是我们世界的一部分。Lance Williams 在 NYIT 把我们介绍给了他。我们相信我们是这份工作的合适人选。所有的迹象都这么说。约翰·拉塞特立即开始为英雄进行角色研究(图 8.15)。
但是我们应该为生产收取多少费用?以前没有人为一部长篇数字电影花钱,所以我从头开始这样做。我计算了数字,将我所知道的关于动画物流、像素分辨率的所有信息都考虑在内我们必须考虑到电脑的成本和速度、所需的存储空间、拍摄成本、人员和设备费用——除了营销和发行成本之外的一切。结果并不好。1985 年的成本约为 5000 万美元(今天约为 1.2 亿美元)。这太过分了两到三倍,尤其是对于这样一项冒险的事业——第一部具有 3D 角色和场景的数字电影。但更糟糕的是:计算它需要我们三年时间。Laurin Herr,我们的翻译和与日本人的业务接口,立即知道这三年是交易的破坏者。所以我们尽可能优雅地退出了这笔交易,并感谢大家。
图 8.15
图片由皮克斯动画工作室提供。
我们学到了宝贵的一课:我们仍然缺乏计算能力,无法经济高效地生成数字电影。我们需要另一个数量级的改进。1985 年,我们清楚地知道摩尔定律告诉我们,还需要五年时间才能获得电影。
在我们拒绝了孙悟空项目之后,我们开始考虑,当摩尔定律最终在硬件性能上达到这个数量级时,我们的软件技术是否足以制作电影,就像 1985 年那样。只是等待摩尔定律的问题吗?这是一个有效的问题,很难准确回答。
当我们在 1970 年代在纽约理工学院第一次构思 The Movie 时,我们认为我们拥有足够的技术,Ed Catmull 的 Tween 程序和我用于前景的 TintFill 程序,我的 Paint3 程序用于背景,David DiFrancesco 的拍摄专业知识,以及用于合成的 alpha 通道. 对于硬件,我们有 18 个帧缓冲区、第一台用于测试的帧精确计算机控制的广播质量视频录像机,以及几台计算机。我们还拥有数字音频,以及我们从同样位于纽约理工学院校园的经典 cel 动画工作室学习的电影物流系统的开端。而且,从某种意义上说,我们可以接触到角色动画师,比如 Johnny Gent,与 Alex Schure 叔叔的Tubby the Tuba相关联工作室。我们周围都是真正制作过长片的人——并且正在制作另一部。这对我们来说并非不可能。
但是这种情况有几件事是错误的。最重要的是,我们很快了解到二维计算机动画对于真正的动画师来说太难了——也就是说,纽约理工学院受过经典训练的 cel 动画师。我们了解到,Alex Schure 的工作室作为制片人确实无法胜任这项任务。
此外,我们当时的电影概念并没有遵循计算机图形学的中心法则。这似乎令人惊讶,因为皮克斯成为以在中心法则“交响乐”形式中创作第一部长篇数字电影而闻名——基于 3D 欧几里得几何模型的角色动画,在牛顿物理学世界中运行,通过虚拟相机以文艺复兴时期的视角观看,并渲染成用于显示的像素。
交响乐形式在当时并不是一个陌生的概念,但一部尊重它的数字电影是遥不可及的。兰斯·威廉姆斯早在 1970 年代后期就曾提出将《作品》作为中央教条形式的电影。他和迪克·伦丁(Dick Lundin)和其他人在纽约理工学院工作,制作了几秒钟的壮观镜头。但 Ed 和我在The Works上运行了摩尔定律的数字,并意识到制作它需要花费数亿美元。换句话说,在当时是不可行的。
但是如果摩尔定律不是一个因素呢?假设总是有足够的计算能力以合理的成本制作一部长篇数字电影。进一步假设角色动画师一直都在。我们什么时候才有足够的技术专长来制作电影?
令人惊讶的答案是,我们总是准备好制作电影——除了一次技术飞跃。从根本上说,总是需要建模、动画和渲染程序,但这些程序的复杂性会并且确实会顺应摩尔定律的浪潮。艺术创意动画师的天才之处在于,他们可以随时将当前的技术水平变成引人入胜的故事。毕竟,迪士尼动画师在 1937 年将铅笔在纸上和在 cels 上的绘画变成了白雪公主。
Central Dogmatic 数字电影的一项必要技术飞跃是运动模糊。我们理解了这一点——不知道如何解决它——在雷·哈里豪森 (Ray Harryhausen) 在杰森和阿尔戈英雄(1963) 中著名的定格格斗骷髅大战中作为观众遭受了不愉快的颤抖之后,我们明白了这一点。唯一的技术障碍,比如说,The Works,如果有足够的摩尔定律力量,当然是缺乏可行的运动模糊解决方案。但回到现实,直到 Cook、Carpenter 和 Porter Proletariat 三人组为André & Wally B. (1984) 解决了运动模糊问题——正如 Porter 1984 年壮观的图片中戏剧性地展示的那样(图 8.9)。但在 1985 年,我们做到了有一个很好的运动模糊解决方案。
我在这些页面中介绍了几种技术技术。采样器包括分形、粒子系统和建模中的补丁。以及渲染中的纹理贴图、凹凸贴图、Phong 着色和光线追踪。但声称是电影不需要这些(除了运动模糊)。沿着摩尔定律曲线向后思考和向前思考一样困难——除非你在那里。我们现在几乎不可能想象没有这些技术和摩尔定律计算能力的世界。
我通过注意到摩尔定律每五年转动一次,就会有更多的技术成为可能,以此来论证这一点。它们经常被用来使对中心教条的坚持变得越来越引人注目。尽管这不是一项法律,但人们可以认为是在维持“生产守恒”。随着摩尔定律以指数方式缩短电影计算时间,改进建模、动画和渲染技术的计算需求扩大,以保持总制作时间不变,例如大约一年左右。这种“恒定性”有时被称为布林定律,归功于吉姆布林。
在实践中,这意味着计算机图形社区不断发明新算法并改进旧算法。他们以更有效的方式改进生产过程。在寻找电影的过程中,这意味着我们在等待摩尔定律实现的同时保持技术进步。
X–10,000,000 X(1985–2000)乔治和玛西娅卢卡斯于 1983 年离婚。由于加利福尼亚是一个社区财产州,乔治实际上在一夜之间失去了一半的财产。在接下来的几年里,这导致计算机部门被分成可以出售的不同单位。首先是 Digital Audio Group 及其产品 SoundDroid,以及 Video Editing Project 及其产品 EditDroid。它们是名为 The Droid Works 的衍生产品的一部分。乔治想要保留在卢卡斯影业中的唯一部分是游戏项目。它将成为 LucasArts。这只剩下计算机图形项目需要处理。
我走进我附近的 Ed Catmull 的办公室,宣布:“我们将被解雇,Ed。乔治从来没有真正了解我们是谁,他再也负担不起我们了。” 然后我用了一个对我们俩都有意义的宗教词,“让这个世界级的集团分散是一种罪过。让我们开一家公司,给他们一个家。” 这是两个电脑书呆子在互相交谈。我们俩都没有中层经理的预算和资源意识,也没有任何关于筹集资金的详细概念。
埃德立即同意了,我们前往一个干净、光线充足的书店,这是一家位于拉克斯珀兰丁附近的受欢迎的书店,毗邻圣拉斐尔,前往旧金山的渡轮就是从那里出发的。我们每人买了两本关于如何创办公司的书。我买了图 8.16 中的两个苗条的。这正确地校准了我们当时的业务专业水平。33
“公司会怎么做?” Ed 合理地问道,因为我们都知道计算机图形项目不能成为依赖于电影,还没有。或者更重要的是,很难利用我们公司的前景。美猴王项目让我们相信,我们需要另一个摩尔定律的曲柄,再过五年及其数量级的改进,才能以具有成本效益的方式制作电影。在此期间,我们必须做一些其他事情来将团队团结在一起。计算使我们确信,无论是软件公司还是数字效果和广告公司,都无法产生足以支持我们 40 人团队的收入。它必须是硬件。34
图 8.16
而且,我们有一台原型专用计算机,皮克斯图像计算机,这是该小组为乔治卢卡斯建造的,作为光学打印机数字化系统的一部分。我们认为,让我们遵循标准的硅谷做法,通过为原型筹集资金并将其投入生产。我们没有任何其他想法。这必须是它。硬件也许可以为我们的团队买单并保持五个几年我们等待摩尔定律。稍加思考就应该提醒我们,我们对市场营销、销售、硬件工程、制造、财务、人力资源等等知之甚少——无论如何,在研究部门之外。那四本小商业书籍大概会教给我们所有这些。我们不顾一切地想把团队聚在一起,去看第一部电影,然后在等待的时候拿到报酬。35
所以 Ed 和我写了一个商业计划来建造和销售 Pixar Image Computers,“像素超级计算机”,并保留一个以 John Lasseter 和 Bill Reeves 为中心的计算机动画专家小组,假设他们会同意这个计划——在接下来的五年里,一旦接到电话,就准备好制作电影。现在我们必须把公司资本化。
但首先,我们必须把它的想法卖给卢卡斯影业计算机图形组的其他 38 名成员。埃德和我带他们每个人,通常一次一个,去圣拉斐尔市中心一家最受欢迎的泰国餐厅。我们描述了这个计划,强调每个员工都将拥有新公司的一部分。直到最后,我们的意思是所有人,无论职位描述如何。
我们需要实体的名称。我们在那里也很平等。每个人都尝试创造一个名字并试图说服其他人。我们以前在这方面失败过一次。我们曾多次尝试将 Lucasfilm 计算机部门命名为“工业光魔”之类的酷东西。甚至乔治卢卡斯也尝试过。但没有两个人能达成一致,所以它仍然是计算机部门。我们又来了。我们在早期文档中使用占位符来表示名称。GFX(读作“graphics”)用了一段时间,但效果并不理想,一搜名字发现反正已经有人认领了。
最后,是时候向加利福尼亚州的国务卿提交公司注册文件了。此正式步骤需要一个名称。绝望中,我呼吁该组织,“你知道,现在每个人都将我们与‘皮克斯’这个词联系在一起,因为它已成为我们计算机的简称。我们为什么不直接使用 Pixar 作为我们的公司名称?” 人们普遍感到失望和不赞成,但我们没时间了,没有人有更好的建议。皮克斯由此得名。我已经解释了我们如何根据一个假的(或者我们说“创造的”)西班牙语动词pixar来命名计算机,意思是“制作照片”。所以皮克斯是一家制作图片的公司。想一想,它会制作假照片——就像不是基于现实或取自现实一样。但与其说是“假”图片,不如说是不真实的图片。
1985 年年中,我和 Ed Catmull 开始为我们的新公司寻找资金。乔治卢卡斯的业务经理热衷于帮助我们,因为任何交易的一部分都会反弹到卢卡斯影业。但我们不知道在他们简单地拔掉我们的插头之前我们还有多久。
第一个想法是接触风险投资家,他们以资助硅谷的初创公司而闻名。在卢卡斯影业的影响力和卢卡斯影业业务经理的帮助下,我们接触了 36 家风险投资或投资银行公司。但我们不符合他们关于种子资本创业公司的想法——他们都拒绝了我们。36
然后我们转而与一家大公司建立“战略合作伙伴关系”。在我们认真交谈的 10 人中,有 8 人拒绝了我们。但我们几乎与通用汽车和飞利浦这两家大公司达成了一项联合交易——通用汽车当时是世界上最大的公司。37
我们处理了 GM 部门,该部门以前是一家独立的公司,即由 H. Ross Perot 领导的 Electronic Data Systems。他就是几年后竞选美国总统的那个人。通用汽车将我们的技术视为一种替代其昂贵的粘土建模技术用于新车设计的方法。
随后飞利浦决定与通用汽车合作分担融资负担。我们拥有一种新的渲染技术,无需手术即可通过 CAT 扫描生成人体的 3D 内部视图,这是一项潜在的革命性医学成像进步。38
它最终归结为在曼哈顿中城举行的一次重要会议,地点在中央车站上方飞利浦大楼的一个董事会会议室。我们与通用汽车、飞利浦和卢卡斯影业签署了一份意向书,日期为 1985 年 11 月 7 日。39
但这笔交易从未发生。我们甚至可能在那个会议室里的每个人都不知道,H.罗斯佩罗三天前就通用汽车董事会斥资超过 50 亿美元收购了休斯工具。以前没有董事会成员在通用汽车董事会会议上反对过——自大萧条以来就没有!那不应该发生。佩罗花了一年时间才真正离开通用汽车,并用 7 亿美元鼓励他这样做。但当消息在《华尔街日报》上发布时,立即清楚的是,通用汽车公司任何涉及佩罗的事情都已经死了。我们的交易就在那个裂缝中。40
这是一个很好的地方来记住这本书的更大的想法是数字光,而不仅仅是数字电影。请注意,通用汽车的车身模拟和飞利浦的医学成像都与数字电影无关。但两者都是 Digital Light 的一部分。车身模拟是计算机辅助设计 (CAD) 的一部分,尽管在我们的案例中,GM 对我们从内部计算机模型渲染的汽车图片比对物体本身更感兴趣。医学成像是图像处理的一部分——拍摄(人体)照片,而不是制作照片。我们还探索了 Digital Light 的其他几个部分,例如地质成像用于油井、智能卫星图像、机械部件的热应力测试、气体动力学。我们已准备好利用这些途径中的任何一种来获得资金,以使我们为实现电影的最终目标而活着。
GM-Philips 是我们最后的希望,也是我们第四十六次尝试获得此类资金。埃德和我现在很疯狂。卢卡斯影业终于没有耐心了。在我们回加州的机场豪华轿车上,我们想出了一个冰雹玛丽——回到史蒂夫乔布斯。
三个月前,即 1985 年 8 月 4 日,史蒂夫邀请埃德、我和我们的财务经理阿吉特·吉尔到他位于伍德赛德的豪宅,那里离帕洛阿尔托不远。史蒂夫刚刚被苹果公司赶下台。他提议从卢卡斯影业收购我们,并将我们作为他的下一家公司经营。我们说不,我们想自己经营公司,但我们会接受他的钱。他同意了。
但是当史蒂夫向卢卡斯影业提出他的建议时,他们没有理会他。他的数字是 7 到 1400 万美元。通用汽车和飞利浦谈的是 20 到 3600 万美元。这笔交易进展顺利。
但现在通用飞利浦的交易失败了,我和埃德决定打电话给史蒂夫,要求他再次提出完全相同的报价,估值不到刚刚失败的交易的一半。我们相信卢卡斯影业最终可能会减少数量。史蒂夫正是这样做的,卢卡斯影业也确实做到了,这就是史蒂夫乔布斯成为资助皮克斯的风险投资家的原因。请注意,他并没有像经常误报的那样购买皮克斯。他资助了一家由员工部分拥有的衍生公司。
这笔交易与我们在 8 月份讨论过的差不多。Ed 和我将作为总裁和执行副总裁管理公司。史蒂夫将成为大股东,我们三个人将成为董事会。我们所有的员工都将获得公司的股份。史蒂夫拿走了 70%,员工拿了 30%。Ed 和我各拿了 4%,其他 38 名创始员工按比例拿了小块。史蒂夫以 1000 万美元为公司注资。我们在签约时从他那里拿到了 500 万美元的第一张支票,Ed 立即将其背书给卢卡斯影业,以购买我们在卢卡斯影业开发的技术的权利,包括皮克斯图像计算机。这是一项专有权利,但卢卡斯影业必须使用我们离开时已有的技术。41
皮克斯于 1986 年 2 月 3 日出生在旧金山北部的圣拉斐尔。我们设法让团队团结在一起,包括我们的动画单位。而且,正如所有初创企业家都必须相信的那样,我们认为皮克斯图像计算机是一款令人兴奋的产品。与此同时,史蒂夫正在运营另一家硬件公司 NeXT,距离旧金山南部大约一个半小时车程。这种身体上的分离原来是天赐之物。
在接下来的五年里,我们通过由 Lasseter 和 Reeves 及其团队创作的一系列短片来保持电影的可能性。这磨练了他们的技能,让我们进一步发展我们的建模、动画和渲染算法,提升了我们的精神。这些短片中有Luxo Jr。(1986),自Le Faim ( Hunger) (1974) 以来第一部获得奥斯卡奖提名的电脑动画电影。这无疑是第一部获此殊荣的中央教条式三维动画电影。然后锡玩具(1988) 获得 1989 年奥斯卡最佳动画短片奖,不是因为它是电脑动画,而是因为它是一部出色的短片。拉塞特和里夫斯因这一成就分享了奥斯卡奖——这是皮克斯在许多人中的第一个奥斯卡奖。这一时期的其他皮克斯短裤是Red's Dream (1987) 和Knick Knack (1989)。在这些艰难的岁月中,这些是支撑我们的四颗闪闪发光的宝石。
每一件作品都代表了底层内部技术的持续改进。例如,Luxo Jr.结合了第一个来自多个光源的自我阴影的铰接物体。两个光源,两盏灯,在场景本身中,另一个在第一个。
在艺术上,小 Luxo是约翰·拉塞特试图说服他在其他地方的动画同事相信计算机不是一个硬、僵硬、线性的算术机器,在某种程度上与他们的艺术形式对立。在这方面,他取得了惊人的成功。每个人,尤其是其他动画师,都对两盏灯的个性做出了回应。迫在眉睫的问题不是他们还活着,而是他们的性别是什么?父子?母亲和女儿?观众可能不太关心底层的几何图形和自阴影。约翰故意没有指明性别。他们是你选择的任何人。
再举一个例子,第二颗宝石Red's Dream旨在展示我们的硬件产品 Pixar Image Computer。这件作品的主要背景是一家自行车店,是当时渲染的最复杂的计算机图形场景。
第五个宝石是 CAPS,我们为迪士尼创建的计算机动画制作系统。它使皮克斯和迪斯尼保持密切的相互钦佩的关系,并且是羽翼未丰的皮克斯的主要收入来源。多年来,每个迪斯尼 cel 动画都是在系统上执行的,使用皮克斯图像计算机运行皮克斯人编写的软件(以及迪斯尼人编写的逻辑软件)。迪士尼在小美人鱼(1989)中的一个场景中首次使用了 CAPS 。第一部使用该系统的完整电影是The Rescuers Down Under (1990)。CAPS 最终被用于总共 18 部迪士尼故事片。迪斯尼是皮克斯图像计算机的主要客户。这是CAPS交易的一部分。42
但皮克斯是一家糟糕的硬件公司。硬件不差,但公司差。即使是著名的硬件制造商史蒂夫·乔布斯(Steve Jobs),持有公司多数股权并担任董事会成员,也不足以使其成功。在这五年里,我们失败了好几次。这是以通常的方式衡量的失败:我们用光了钱,无法支付账单或员工。如果我们有史蒂夫以外的任何其他投资者,我们就会死在水里。但在每次失败时——大概是因为史蒂夫无法忍受在苹果下台后他的下一个企业将是失败的尴尬——他会斥责我们这些管理人员。. . 然后再写一张支票。并有效地贬低员工权益。在几次这样的“再融资”之后,他将自己 1 亿美元的苹果财富的一半左右投入了皮克斯。在今天的金钱中,他向皮克斯投入了大约 1.15 亿美元。1991 年 3 月 6 日,在皮克斯的第五个年头,他终于确实购买了公司,但从员工那里购买,而不是后来描述的 1986 年从卢卡斯影业购买。现在他完全拥有了。我们的员工甚至不再拥有一份股份。43
该公司仍处于严重的财务困境中。我们尝试了各种小事情,比如基于约翰·拉塞特和比尔·里夫斯的小团队的电视广告业务。但这些想法都没有足够的创收能力来支付我们公司的费用。乔布斯探索了将我们纳入 NeXT 的想法,但他的联合创始人不想参与其中。真的只有一个出路。摩尔定律必须通过使电影最终在经济上可行来拯救我们。只有电影有足够的潜在回报来拯救我们。
这是一次疯狂的旅程。. . . 我与皮克斯的合作是光荣而短暂的,但我认为这是我职业生涯中最富有成果和最愉快的时期之一。
皮克斯在电影前几年的第六颗也是皇冠上的宝石是RenderMan。它的名字是索尼随身听的双关语。45
通往 RenderMan 的道路始于 1970 年代犹他大学的 Gouraud 着色或 Phong 着色等单独的着色技术。然后,正如我们所见,Rob Cook 在 1980 年代初期在卢卡斯影业将这一概念推广到了一种着色语言中。他将自己的系统编写为 Lucasfilm 内部渲染解决方案的前端,该解决方案是最初由 Loren Carpenter 编写的 Reyes 渲染器,然后由 Rob 进行了大幅改进。Reyes (发音为“Rays”)这个名字是 Loren 的巧妙首字母缩写词,意思是“渲染你所见的一切”,或“渲染你所见的一切”。雷耶斯表彰当地的雷耶斯角国家海岸,并被开发为在卢卡斯影业的特定硬件上运行。46
下一个重大飞跃是将着色语言从 Lucasfilm 硬件的特殊性中解放出来。这是从特定语言到标准语言的飞跃——从一家公司的硬件到任何公司的硬件。这是创建统一计算机图形行业的飞跃——因此 RenderMan 的重要性。
回忆计算章节中的名片通用图灵机。这台机器可以理解一种带有如下指令的语言:“3 : 4← [glyph],”意思是,“如果你在孔的胶带方块上看到 3,然后用 4 替换它,向左移动一个方块,然后旋转卡片,使其看起来像字形。” 每台计算机都有一种类似折磨人的机器语言,该语言是该特定计算机独有的。
计算方面的突破是标准高级编程语言的开发,例如贝尔实验室的 C,可以在任何计算机上运行。用户用类似英语的语言编写程序。该程序通过一个程序员不必理解的特殊程序(称为编译器)传递,该程序将标准编程语言转换为特定计算机的机器语言。例如,当有人购买 Unix 系统时,它配备了高级 C 语言和一个将 C 编译成购买者拥有的机器的低级机器语言的编译器。从某种意义上说,不同的机器有不同的C。
同样,RenderMan 使图片制作者不必了解任何一家公司的渲染硬件的细节。当您购买 RenderMan 时,您将获得它的着色语言、该语言的编译器以及支持该语言的任何特定硬件的完整渲染系统。比如说,一个电影制作人只需要知道 RenderMan 的着色语言,而 RenderMan 系统会在幕后处理剩下的事情——像素的生成,可以这么说。
领导 RenderMan 标准的人是 Pat Hanrahan,他是皮克斯公司成立后的第一批员工之一。Pat 是一个温和的男人,他从蠕虫的世界来到计算机图形的世界。
作为威斯康星大学的研究生,他专门研究蛔虫的神经结构,蛔虫是世界上分布最广的寄生虫,可能感染了 10 亿人。这种大型蛔虫可以达到一英尺长,它们的菌落生活在肠道、肺部和血液中。是什么让帕特从恶心的蠕虫变成了漂亮的像素,这是一个谜,但这就是发生的事情。在卢卡斯影业团队离开后,他加入了纽约理工学院的实验室,开始了他的新方向。然后他找到了从纽约到加利福尼亚的路,成为皮克斯的另一个常驻天才。
将团队其他部分的人员引诱到计算机图形学领域的传统仍在继续。题词的吉姆劳森以前是卢卡斯影业数字音频项目的一部分。和 Pat Hanrahan 一样,他也在皮克斯成立后不久就加入了。Jim 和 Pat 合作将 Rob Cook 的内部着色语言强化为面向外部世界的 RenderMan 着色语言。Lawson 将为 RenderMan 编写“幕后”像素生成器。47
这里不是提供 RenderMan 详细信息的地方,但其现在标准着色语言中的一些官方术语的简短列表肯定不会让您感到惊讶:凹凸、深度、phong、折射和纹理。该语言允许您定义光源、阴影和像素散布器。以及更多。
RenderMan 将艺术家与工具分离。卢卡斯影业和皮克斯以外的任何人都很难使用 Carpenter 和 Cook 的渲染器 Reyes。RenderMan 将这项技术提供给皮克斯以外的一群新人——艺术家和技术人员。有了它,建模程序 A 可以与 RenderMan 渲染器 X 对话,建模程序 B 可以与 RenderMan 渲染器 Y 对话。尽管所有部分(A、B、X 和 Y)都是完全独立开发的,但一切正常。从某种意义上说,有不同的 RenderMen [ sic] 适用于不同的计算机。换句话说,人们可以使用该语言编写不同的 RenderMan 渲染器,这些渲染器可以与各种建模程序一起工作并在各种计算机上运行。从固定着色技术到着色语言(Cook)的转变是巨大的,从特定语言到标准语言(Hanrahan)的飞跃又是巨大的。
创建一个好的标准很难——它必须设计得非常好才能普遍工作并随着时间的推移而保持不变。以前有许多图形标准,但 Hanrahan 是第一个包含可编程着色的标准。它所提供的灵活性是 RenderMan 能经受 30 年之久的原因。
RenderMan 于 1990 年出版,已成为好莱坞基于计算机图形学中心法则的视觉效果和动画的主打产品。RenderMan 不是一次创建一种算法来为三角形着色,每个算法都与其他算法不兼容,而是为所有此类算法建立了一个共同的基础。它是渲染过程的生产力增强器。48
该行业已经为开发者提供了丰厚的回报。Rob Cook、Loren Carpenter 和 Ed Catmull 因在 2001 年的贡献而获得奥斯卡奖,这是有史以来第一个授予计算机科学的奥斯卡奖。Pat Hanrahan 获得了三项技术奥斯卡奖,一项与 Loren、Rob、Ed 和其他人为 RenderMan 分享。Rob、Ed 和 Pat 都获得了 Siggraph 的 Coons 奖,这是它的最高奖项。而且,当我在 2020 年 3 月完成这份手稿时,我刚刚被告知 Ed Catmull 和 Pat Hanrahan 获得了图灵奖。49
摩尔定律终于超过了另一个数量级——达到了 100,000X步。迪士尼于 1991 年(皮克斯创立五年后)挺身而出,并说:“让我们制作你一直想要的电影吧。” 他们资助了它,挽救了史蒂夫乔布斯的面子(和投资)和皮克斯公司。这部电影不是史蒂夫·乔布斯的主意,正如有时被误传的那样。乔布斯正在运行 NeXT。他从不谈论电影。这是迪士尼自 1970 年代以来的想法,也是我们的梦想和目标。
这就是电影,正是我们苦苦等待了五年的电影。但有一个问题。我们的首席动画师约翰·拉塞特拒绝与迪士尼合作。毕竟他们解雇了他。他坚信,时任迪士尼动画主管的杰弗里·卡岑伯格是一个他无法共事的暴君。所以,埃德和我又一次疯狂了。
卡岑伯格明白了这个问题并陷入了困境。1991 年,他在迪斯尼伯班克总部召开了一次会议,旨在说服约翰他可以与迪斯尼合作,也可以与他自己合作。Ed 和我参加了这个重要的会议。约翰·拉塞特和比尔·里夫斯也是如此,我们紧密的动画师和程序员二人组。史蒂夫乔布斯的出现大概是为了评估暴君卡岑伯格。
卡岑伯格主持了会议。他首先让我们感到惊讶。“我试图从你那里雇佣约翰,但他很忠诚,不会离开。” 我们不知道。约翰没有告诉我们。“所以为了发挥他的才华,迪士尼将与皮克斯合作制作这部电影。” 我套用卡岑伯格的话说:“约翰,我知道你认为我是个暴君,所以我们今天要做的就是这个。我会离开房间,史蒂夫也会。然后,如果你愿意,其他人可以互相交流几个小时,并提出最棘手的问题,比如这里的真实情况,我的真实情况。” 这就是发生的事情。尤其是约翰,在下午剩下的时间里,他与迪士尼的动画师和导演进行了深入交谈。
一天结束时,约翰和我在其他人面前一起走一小段路,回到我们租来的汽车,开车去伯班克的机场。“你怎么看?” 我紧张地问道。“我能做到,”约翰说。我当时就知道这笔交易是出于所有实际目的。它仍然必须进行谈判和签订合同,但没有任何实质性内容。
但我不得不离开。我不得不让史蒂夫乔布斯离开我的生活。大约一年前,他在臭名昭著的“白板事件”中以完全欺凌、专横的方式攻击了我。沃尔特·艾萨克森 (Walter Isaacson) 的著作史蒂夫·乔布斯 (Steve Jobs ) 对此进行了简要描述。50
现在,我知道电影 15 年前的愿景即将实现,我可以离开皮克斯了。因此,我与皮克斯协商离开,创办了一家新公司,Altamira Software(为洞穴,并使用另一个西班牙名称)。它基于一个像素编辑产品主要基于 Alpha 通道。该产品于 1994 年上市,几个月后微软收购了该公司。
Ed Catmull 于 1991 年 7 月完成了与迪士尼的电影交易。我们在皮克斯用香槟庆祝它,我在那里一直维持着一个办公室,直到 1991 年 9 月。51
然后就发生了!在接下来的四年里,皮克斯在迪斯尼的帮助下完成了电影,并于 1995 年首映。该团队首次在纽约理工大学聚首已经 20 年,距离他们在卢卡斯影业扩张已有 15 年。皮克斯成立已经快 10 年了。玩具总动员汇集了我们在本章中遇到的天才们强大的技术和艺术创造力,而这些天才又建立在前几章中介绍的数十年的才华和成就之上。这部电影是数字大融合到来的恰当典范。虽然集中在 Digital Light 的数字电影部分,但它的技术很快就会影响到其他部分,如视频游戏和虚拟现实。几年之内,三维动画特征将取代二维 cel 动画。Digital Light 不止于此。它已经接管了。
《玩具总动员》几乎在电影“装在罐子里”之后就大获成功。皮克斯和迪斯尼把它带到纽约市,让评论家们第一次看到,他们的热情是电动的。
乔布斯看到了这一点,做出了一个绝妙的举动,挽救了他的商业声誉,使他成为了亿万富翁。他决定将皮克斯公之于众,只不过是对玩具总动员的承诺。皮克斯几乎没有现金,除了出售公司失败的硬件部分的零碎,将我的公司 Altamira 出售给微软的百分比,以及微软和 Silicon Graphics 支付的运动模糊专利许可费。 ,吉姆克拉克的第一家公司。皮克斯的公开募股发生在 1995 年 11 月 29 日,进展顺利,是当年最大的一次,甚至超过了吉姆·克拉克的第二家公司网景。52
从《玩具总动员》 (1995)开始,关于皮克斯的成功已经写了很多,我在这里只多说一点。到千禧年左右,皮克斯制作了另外三部成功的数字电影:虫虫的生活(1998)、玩具总动员 2 (1999) 和Monsters, Inc. (2001)。截至撰写本文时(2020 年),皮克斯已经制作了 23 部数字电影。迪士尼终于在 2006 年以超过 70 亿美元的价格收购了这家公司。考虑到 1970 年代我们弯着膝盖接近他们时,他们本可以免费获得我们,这是令人震惊的,在 1980 年代中期乔布斯是我们的最后机会,万福玛丽投资人时以 1000 万美元,在 1980 年代后期以 5000 万美元他会把我们卖给任何人,让自己变得完整和不尴尬。
Pacific Data Images 经营着一家聪明的公司。他们不是第一家计算机图形公司,但他们比 1970 年代末和 1980 年代初同时成立的所有其他公司都长寿。他们使用现成的计算机,从未犯过购买或租赁超级计算机的错误。他们通过制作数百个广播电视图形(例如飞行徽标)来自强不息。1985 年,他们提出了一部数字电影,但无法资助。考虑到我们大约在同一时间得出结论认为猴子电影不可行,这并不奇怪。但这也意味着皮克斯可能应该将它们视为电影的竞争对手。
PDI 在 1980 年代后期创作了几部短片,就像皮克斯在同一时间制作的“珠宝”一样。一些 PDI 珠宝是Opéra Industriel (1986)、Burning Love (1988) 和Locomotion (1989)。53
PDI 没有放弃电影的想法,于 1991 年成立了角色动画小组,以获得数字电影所需的技能和艺术家。埃里克·达内尔(Eric Darnell)当时加入了,他是一名动画师,刚从加州艺术学院毕业,这所迪斯尼创办的学校培养了约翰·拉塞特和布拉德·伯德(尽管达内尔毕业于实验动画而不是角色动画)。他很快创造了自己的一颗宝石,气体星球(1992)。54
1994 年,杰弗里·卡岑伯格 (Jeffrey Katzenberg) 在与总裁迈克尔·艾斯纳 (Michael Eisner) 以及沃尔特 (Walt) 的侄子罗伊·E·迪斯尼 (Roy E. Disney) 的权力斗争中离开了迪士尼。然后,史蒂文·斯皮尔伯格、卡岑伯格和大卫·格芬在 1994 年末利用微软联合创始人保罗·艾伦的主要资助共同创立了梦工厂 SKG(代表三位联合创始人)。
DreamWorks SKG 于 1995 年收购了 Pacific Data Images 的大部分但少数股权。新公司更名为 PDI/DreamWorks,后来当 PDI 的少数股权转变为多数股权时,DreamWorks Animation 更名为梦工厂动画。我将在这里使用梦工厂作为名称。它于 1998 年 10 月 2 日发行了其第一部数字电影《Antz》,由 Eric Darnell 联合导演。55
在安兹之后,埃里克在梦工厂的第二部数字电影《怪物史莱克》(2001)中担任故事艺术家。2001 年为最佳动画长片设立了一个新的奥斯卡类别。史瑞克是第一部赢得该奖项的数字电影,击败了皮克斯的怪物公司(2001 年)。
梦工厂在本文中(2020 年)制作了许多数字电影,包括马达加斯加系列中的四部、史瑞克系列中的五部、功夫熊猫系列中的六部和驯龙高手系列中的三部。
PDI 和梦工厂应该得到比我在本章中更多的关注。我只讲述了与创建皮克斯的流程有关的故事。这个群体所取得的许多技术进步值得某人充分对待,而个人球员应该每个人都得到发展。MAGI和Blue Sky也应如此,总结如下。
他们将自己的想象力投射到其中并对其进行膨胀,所以看起来角色几乎就像从屏幕上伸出来一样。座位和屏幕之间的空间充满了这种非常明显的参与能量,而这种能量的波动——或者说它的强度——成为了我从那一刻开始关心的唯一衡量创意完整性的标准。
——克里斯·韦奇,《冰河世纪》(2002 年)的导演,关于首映时的观众56
MAGI 和 NYIT 在 1970 年代后期都是纽约州北部的计算机图形工作室,它们的位置相距约 20 英里,因为乌鸦飞了,但只有乌鸦飞了。纽约市介于两者之间。
Carl Ludwig 是 MAGI 的 Celco 顾问,他在 1970 年代后期与 NYIT 的 David DiFrancesco 合作,当时 David 正在考虑购买一台 Celco 电影录像机。MAGI 在迪斯尼的《创》(1982 年)中使用了 Celco 记录仪,随后聘请了路德维希,后者继续改进 MAGI 的光线追踪软件。
Chris Wedge 是Tron的主要 MAGI 动画师。然后他和迪斯尼的约翰·拉塞特在 1983 年在那里合作进行了 Wild Things 测试,拉塞特负责二维前景,楔子负责三维背景。
1987 年 2 月,MAGI 关闭后,Wedge、Ludwig 和其他四人在东海岸共同创立了 Blue Sky Studios。这几乎是在 Ed 和我于 1986 年 2 月在西海岸共同创立皮克斯之后的一年。Blue Sky 在最初的几年里靠电视广告和故事片效果维持生计。
他们也有他们的珠宝。两个早期的由 Chris Wedge 创建。第一个是在大部分真人电影乔的公寓(1996 年)中的一系列蟑螂电脑动画镜头。韦奇在 1997 年收购蓝天的贡献给 20 世纪福克斯留下了深刻印象。
与此同时,Wedge 还在创作他的第二颗宝石,一部名为Bunny的短电脑动画(1998 年)。它在 1998 年获得了奥斯卡最佳动画短片奖。蓝天已准备好迎接大时代。57
由韦奇执导的《冰河世纪》 (2002 年)是该公司在数字电影领域的处女航,是众多成功中的第一次。《冰河世纪》获得 2002 年奥斯卡最佳动画长片提名。截至撰写本文时(2020 年),该公司已经制作了 13 部数字电影,其中仅冰河世纪系列就有 5 部。
正如我之前所说,这远远不能满足MAGI和Blue Sky应该得到的全部待遇。但这里不是地方。正确和真实的是,皮克斯、梦工厂和蓝天在很短的时间内用长篇数字电影在千禧年庆祝了伟大的数字融合。
在最后一章中,我重新对所有 Digital Light 进行了讨论。为了不让 The Movie 和它的同胞让我们眼花缭乱,我们需要重新建立真正巨大的 Digital Light 席卷,其中数字电影部门只是一个例子。
从 1967 年的第一部彩色像素到千禧年的第一部数字电影,我们在 Epoch 2 计算机图形学的前 30 多年的快速旅程结束了。在那些年里,摩尔定律一直是不屈不挠的参与者。从 1965 年的 1 倍,到千禧年,它爆发到 10,000,000 倍——七个数量级!第一个彩色像素需要它,第一部数字电影更是如此。如果没有摩尔定律和它所代表的创造性工程胜利,这里就不会有故事。
我们已经停在了千禧年,就在大型计算机动画工作室赚到数十亿美元之前。从那以后的近二十年里,我几乎没有提到摩尔定律因子已经达到 100,000,000,000 X- 四个数量级!这是正在进行的革命和工作室成功的原始燃料。它终于让 VR 变得实用了。
数码电影只是数码光浩瀚海洋中的一滴水。然而,电影中的许多教训可以用来理解 Digital Light 的其余部分。例如,VR 的叙事形式本质上是两部实时计算的数字电影,每只眼睛一部用于立体效果。添加交互性以获得VR的游戏形式。你所知道的关于建模、渲染、像素、显示、抗锯齿、动画和中心法则的一切都直接从一个领域转移到另一个领域。
这本书的许多章节的主题是(1)一个想法,(2)驱动它的混乱,以及(3)一个暴君——或者不那么贬义地,一个赞助人——经常在不知不觉中提供足够的空间或保护实现的想法。在本章中,主要的想法是计算机可以制作长篇动画电影。推动他们创造的混乱是可怕的摩尔定律爆炸造成的宇宙破坏。理解七个数量级的破坏的唯一方法是简单地生活并驾驭波浪,因为它一次显示一个数量级。
至于暴君和赞助人,皮克斯最初的赞助人是亚历山大·舒尔,他首先为我们提供了一个美丽的地方和合适的设备——当时世界上最好的——用于早期开发。亚历克斯叔叔是现在被称为皮克斯的集团的富有赞助人中最奇怪的一个。他是第一个——也是最勇敢的,或者最疯狂的——他们所有人,也是唯一一个失去一切的人。接下来是乔治卢卡斯和史蒂夫乔布斯,他们都成为了亿万富翁,乔布斯的第一个十亿直接来自他对皮克斯的投资。非正式地,在电影和动画章节中讨论了第四位无名赞助人,沃尔特的侄子罗伊迪斯尼。他凭借自己的影响力在两个关键时刻挺身而出。结果,迪士尼公司最终收购了皮克斯,现在拥有它,并从中赚取了数十亿美元。
但我们的主导赞助人史蒂夫乔布斯也是我们的主导暴君。大概是为了挽救他的自尊心,他提供了金钱和时间,使我们有可能度过过去几年的地狱,以实现电影的伟大创意。
史蒂夫与玩具总动员没有任何创造性的关系。拉尔夫·古根海姆(Ralph Guggenheim)在纽约理工学院与卢卡斯影业首次接触并成为皮克斯的《玩具总动员》联合制片人,他在最近的一本书中说:“我会说,在 86 年到 95 年之间,当《玩具总动员》问世时,史蒂夫可能——我没有夸大其词——我不要以为他在九年内来我们大楼的次数不超过九次。” 史蒂夫确实喜欢约翰·拉塞特拜访他并向他展示部分电影结果,这样他就可以畅所欲言了。但就像我和埃德如果可以避免的话,永远不会让史蒂夫进入皮克斯的建筑一样,拉塞特也不会让乔布斯参加皮克斯的故事会。这几乎无关紧要。史蒂夫当时正在经营 NeXT,距离一个半小时路程,严重的财务问题让他忙得不可开交。58
但乔布斯在对已完成的《玩具总动员》的批评反应中跃跃欲试,并出色地让皮克斯上市。乔布斯的公开募股营销故事的一部分是他的新神话,即他与人共同创立了皮克斯并从一开始就担任首席执行官。这两种说法都不是真的,这是有据可查的。在《玩具总动员》上映时,他确保自己站在镜头前,而不是 Ed Catmull。59
我不指望你在读完这些章节后能够渲染电影,但我确实希望从计算机中提取电影的神秘感已经大大降低。该过程本质上是这样的:计算正确代表每个像素位置的平均颜色。这可能是并且通常是复杂的计算。但它是一个计算——一个包含许多步骤的明确定义的过程。这就是计算机所做的。它在每个像素上重复这种计算,对于电影的一帧,它会重复数百万次。然后它再次重复计算,每帧数百万次,超过十万帧。正是 Amplification 的荣耀使得如此多的计算步骤在合理的时间内发生——比如长片的几个月到一年。
但我无法解释存在于几个人类贡献中的压倒一切的谜团:艺术家创作带有感人情感的故事。动画师启发了那些由几何构造的角色。程序员将数百万个无意义的计算机步骤组织成有意义的计算,以将故事和角色渲染成电影帧。工程师改进了底层芯片技术,以达到前所未有的摩尔定律速度。所有这些都是纯粹的莫名其妙的人类创造力。
在接下来的最后一章中,我重新审视了理念-混沌-暴君的主题,因为它已被所研究的每一种技术所指导或修改。我还回顾了从各个章节中得出的其他几个一致的教训:简单叙述的不足,技术的谱系,定义每一个的令人惊讶的流程,技术思想的实际简单性——以及它们的美丽——以及真正魔法的存在,至少我们今天(不)理解它,由人类提供。
经典被定义为“被接受为真实的神圣书籍的集合或清单” 。我希望通过这本书确立基于神圣事实而非神话的数字光经典的开端。现在开始这项任务还为时不晚。我们距离新千年只有 20 年,而 Digital Light 将无限期地延伸到未来。60
在引言中,我承诺解释图片是如何与媒体分离的——一头野猪是如何在几千年后从阿尔塔米拉的洞穴壁上小跑的,或者雅克-路易·大卫的英雄传记拿破仑是如何骑着他的骏马离开欧洲的皇家城墙的并进入本书的开篇。
这种解释要求我提出一个被低估的关键想法——像素。这直接导致了数字光,这是一个由像素介导的广阔图像领域,主宰着现代视觉世界。事实上,它是如此之大,以至于我有选择地修剪了 Digital Light 部分以适应书中的内容,同时忠实地代表了整个主题。出乎意料的复杂像素将它们全部绑定在一起,并可以将所选部分的细节推广到整个域。
在最后一章中,我将镜头拉远到足以让我们再次看到所有数码灯。我讨论了自从我选择故事的终点以来的两年内发生的事情,即千年。根据摩尔定律,这是四个数量级之前的数据,而X在此期间计算机的功能已经提高了 10,000 倍——符合“定律”。
革命在继续,所以我也尝试做“数量级”这个短语所暗示的不可能的事情:预测随着摩尔定律放大因子在 2025 年达到 1万亿倍时接下来会发生什么,然后...... X. . 它不是无穷大,但数字仍然大得令人难以置信。那未来会怎样?
但首先,让我们回顾和评论关键的基本技术点。
数码灯是由像素组成的任何图片。这是一个非常广泛的类。它包括当今世界上几乎所有的图片。事实上,由于数字爆炸,Digital Light 包含了几乎所有曾经存在的图片。但这只是成为现实最近,从 2000 年左右开始,即千禧年——在一个我称之为大数字融合的不为人知的事件中。这种变化悄无声息地悄悄袭来——而且很快——似乎是一夜之间。所有媒体类型都融合为一个通用数字媒体,比特。图片与其显示的分离变得完整。但是,融合怎么可能是分离呢?
答案恰恰在于像素(图片元素的缩写)和显示元素之间的区别。这些不同类型的混为一谈仍然是当今世界上最普遍的技术混淆之一。两者通常都被称为“像素”,但事实并非如此。像素是视觉场景中某一点的数字化样本。我们看不到一个点,因此我们看不到一个像素。我们可以看到的显示器上的小发光区域是从底层看不见的像素进行的模拟重建。我们称这样一个微小的发光点为显示元件。
显示元件将数字像素作为输入并输出模拟色光斑点。我们说一个像素必须被一个显示元素散布才能被看到。那些颜色的斑点——顺便说一句,它们几乎不是小方块——重叠形成一个平滑的连续图片。
像素是离散的、尖锐的、分离的、数字的和不可见的。显示元素(散布像素)发出平滑、连续、重叠、模拟,当然还有可见光。
像素是普遍有效的,但显示元素远非普遍。显示元素因设备和制造商而异。
像素简洁地代表一张图片。由这些像素驱动的显示元素显示它。这正是改变现代图片世界的图片与其显示的分离。. . 并呼吁我在本书中努力澄清像素/显示混淆。
当所有图片都可以用像素表示时,对其他媒体类型的需求就消失了。这是大数字融合的时刻。因此,数字像素与模拟显示元素的分离使许多模拟媒体类型能够融合到一种数字或通用媒体中。
像素是通用的这一事实是大数字融合起作用的原因。我可以将手机中的任何像素发送到我的笔记本电脑、台式机、喷墨打印机、电视机、任意酒店房间的电视机、我妻子的手机或她的笔记本电脑的显示器上,任意演讲厅中的 PowerPoint 投影仪等。或通过互联网连接到您和您的设备。这些设备的显示元素差异很大,但在所有情况下,像素都是相同的。
我的手机包含数千张图片,每张都有数百万像素。我怀疑你的差不多。显然,这些图片“在里面”某处,但你看不到他们。如果我要求看其中一张图片,那么在那一刻——似乎是瞬间的——像素的扩散发生了,图片显示是从它的像素表示中重建的。
这个方案有效是伟大的采样定理的礼物——数学上的胜利。它发生得如此之快且分辨率如此之高的事实是伟大的摩尔定律的礼物——一个工程奇迹。
这一计划的安静但革命性的转变恰巧发生在千禧年。不久前,它成为标准假设我们可以随时随地看到我们的像素。总会有一种显示设备,一种理解通用媒体的设备,可供我们使用,以供我们观赏。这就是数字大融合的意义所在。
但究竟什么是像素?它们的离散网格——一个尖尖的钉床——如何准确地代表一个平滑的视野?Digital Light 的基本定理(对“真理”的幻想)回答了这一切。这是采样定理,由 Vladimir Kotelnikov 在 1933 年以完整的现代形式带给我们。他令人惊讶的数学结果是所有现代视觉媒体(以及音频)的支柱。该定理说,要准确地表示一个视野,请在规则间隔的点网格(因此是钉床)上对其进行采样,其中间隔必须满足某个标准:样本间隔的频率必须超过最高频率的两倍场景中的傅立叶频率。
这足够抽象和不直观,足以解释为什么我们大多数人还不知道像素是什么。让我简明扼要地说明定义,在括号中稍作调整以确保准确性:像素是在(大于)其中最高傅立叶频率的两倍处拍摄的视野的(数字化)样本。只要您记得括号中的位,您就可以在以令人难忘的方式陈述定义时省略它们:像素是在其最高频率的两倍处拍摄的视野样本。
这个奇怪的词频支配着定义,就像采样定理一样。所以我用本书的第一章来解释什么是(傅里叶)频率。Joseph Fourier 的伟大想法是:视野可以表示为不同频率和幅度的波的总和。是音乐。大多数人都明白,音乐是不同频率(音高)和不同幅度(响度)的声波的总和。傅立叶告诉我们,视觉场景也是如此。它是不同频率和幅度的颜色亮度波的总和。
我正在苏格兰的一座城堡里写这最后一章。在附近的商店出售的薯片产品(图 9.1)将帮助您在下面的解释中想象出沟槽与波纹的关系。
亮度波可以被描绘成一块宽大的波纹金属板或带沟的薯片。它的频率是它在空间上上下摆动的速度(比如芯片每英寸摆动四次),它的幅度是它摆动的最大高度(亮度)。令人惊讶的是,将不同摆动率和亮度高度的波纹或沟纹加在一起,可以为您提供例如您的孩子或宠物、大峡谷或银河系的照片。亮度波是空间的,响度波是时间的,但数学并不能区分两者。对一个人有用的东西也对另一个人有用。这就是傅立叶教给我们的。
我希望你会开始看到视觉世界的音乐结构——它的频率。它们无处不在,可以迅速成为一种新的观看方式。
傅立叶的想法是表示模拟视觉场景的另一种模拟方式。Kotelnikov 的想法是用数字方式来表示模拟视觉场景。他的采样定理从傅立叶表示开始,告诉我们如何从中获取像素,然后在我们需要时如何从中查看原始场景。正是采样定理使像素定义的后半部分——最高傅里叶频率位的两倍——如此重要。第二章解释了这种魔法是如何运作的,这证明了将第一章专门用于傅里叶波是合理的。
第二章的另一个目的是表明数字并不比模拟少。采样似乎意味着样本之间无限量的信息丢失了——数字只是一个近似值——但事实并非如此。如果正确应用采样定理,则证明数字不会丢弃任何东西。相反,它是对无穷大的极其巧妙的重新包装。
Digital Light 的一半——制作部分(相对于拍摄部分)——源自计算机。所以在第三章中,我解释了数字光的第三个伟大的基本思想:计算,以及使计算快速进行的称为计算机的机器。. . 和电脑动画电影成为可能。
中心思想很容易理解:计算是一个仔细的过程,通过将其分解为一系列更小、更简单的步骤来完成。但那句无伤大雅的句子并不像看起来那样平淡无奇。它包含众多。
1936 年年轻的剑桥学生艾伦·图灵是第一个完全掌握它、命名它并发现其中的惊喜的人。有前人看过计算的承诺——莱布尼茨、巴贝奇、洛夫莱斯——但最终并完全掌握了计算的是图灵,他以惊人的天才一击。他用一台简单的机器解决了一个困难的数学问题——这里称为 eProblem。他的解决方案——使用我们现在所说的“图灵机”——彻底改变了世界。这是一台简单得惊人的造纸机,以至于他的导师马克斯·纽曼起初认为它只是一个玩具。
图 9.1
我用一张名片和一些纸带设计了一个图灵机,以在第 3 章中演示它们是多么简单。它可以在四个方向之一“操作”,它使用六个符号的字母表。而已。但是这台机器可以计算世界上任何可计算的东西。这是图灵最深刻的结果的一个例子:有一台机器可以计算任何其他此类机器可以计算的东西。我们称之为通用图灵机。这就是现代计算机直接产生的想法,也使图灵与他的思想先辈们区分开来。
但他发现的细节很重要。他表明,任何一台特定图灵机的计算都可以编码成一串符号。我们今天称其为程序,我们通常称程序员为编码员。图灵表明,如果一个程序像数据一样存储在通用机器中,那么该机器可以模拟程序中编码的特定机器。换句话说,它可以计算与特定机器相同的东西。因此,只需更改程序,通用机器就可以计算任何东西。图灵不仅第一次彻底地描述了计算,而且还发明了存储程序计算机。所有现代计算机都是通用存储程序计算机。它们是图灵的想法,旨在快速发展。
但在探讨这意味着什么之前,让我强调计算的奇迹,这是有史以来最深刻的思想之一,但现在却如此普通。图灵的想法曾经而且非常庞大,以至于它包含了所有已知的执行谨慎过程的方法。另一种说法是:计算机是人类制造的最具延展性的工具。可能的计算数量是无法理解的。从来没有人发现过使用存储程序计算机无法完成的细致过程。因此,经过大约 80 年的经验,我们现在认为,仔细处理和计算这两个想法是等价的。
计算机有时被认为是一个锋利的、僵化的、确定性的、非常复杂的数字运算机器。有些人认为,这样的机器肯定与微妙、神秘、艺术、优雅或智慧无关。关于人们可以用计算机制作什么样的图片的假设常常被这种误解所影响。这就是为什么在第 3 章中,我打破了五个神话来揭示计算的真正美。
首先,计算不仅仅是数字运算。它们是关于模式操作的。可以肯定的是,我们经常操纵的流行模式之一是数字,但认为计算机受数字约束是错误的,并且会妨碍我们的想象力。这种特殊误解的部分原因可以追溯到计算机基本上是 0 和 1 的概念,因此本质上是基于数字的。但是计算机中没有小的 0 和 1。0 和 1 都是两种状态的简单名称,通常是现代计算机中的两种电压。我们也可以,但不那么方便,称他们为 Mutt 和 Jeff。计算机是关于改变状态模式的,而不是在做算术。
其次,认为计算机必须由位组成(当然,有两个状态分别称为 0 和 1)的信念是错误的。我们“操作”的名片机由四种状态组成,而不是两种状态。它是 4 进制的,而不是二进制的。这些状态是名片的方向,而不是数字。但是,正如我在第四章中解释的那样,所有现代计算机都是由比特构成的。事实证明,这个选择是我们通往惊人速度的道路——通往称为放大的第二个计算奇迹——但这不是必需的。
第三,计算机不一定是电子的。然而,再一次,由于我们对速度的无法抑制的渴望,所有的计算机都是电子的。就像使用比特的选择一样,电子产品最终成为我们实现惊人放大的途径。但这也不是必需的。
第四,计算机是确定性的,但这并不意味着它看起来的样子。确定性可能是计算中最容易被误解的方面。我以这种方式陈述艾伦·图灵的发现:在小处确定并不意味着在大处预先确定。确实,计算机执行的每一步都很简单且完全确定。确实,必须完全确定任何此类步骤序列的最终结果。但这并不意味着我们可以预测或预先确定结果将是什么。尽管每个步骤都已确定,但通常计算可能无法预测。通常,确定计算将做什么的唯一方法是执行它。
这通常不会影响 Digital Light——我们通常知道我们的计算将要做什么——但它可以用来校准我们的计算概念。假设计算机是刚性的和确定性的并不能保证计算公正。有些人认为,由于这种僵化和确定性,计算机不可能成为人脑的模型。但科学家们正在努力研究人工智能 (AI),这是艾伦·图灵首先追求的另一个想法。将以下句子与上一段中关于计算的类似句子进行比较。一般而言,确定人类会做什么的唯一方法是退后一步,看着他们过自己的生活。
第五个也是最后一个神话是计算机很复杂,而我们真正的意思是它们可以非常快地完成许多简单的事情。计算机执行的每一步都很简单且毫无意义,就像“将位左移(或右移)一个位置”之类的操作。这里有一个复杂性的奥秘,但它不是计算机的复杂性。我们无法解释一个人如何创建一个包含数千甚至数百万个愚蠢步骤的列表,这些步骤可以做一些有意义的事情,比如计算一部电影。这是人类创造力的复杂性——甚至是谜团。
在数码光的早期,这些误解导致人们认为计算机只能产生有限种类的图片。例如,最初假设计算机只能制作块状图片,或者动画运动必须沿着不优美的直线。但实际上并不存在这样的限制。令人信服的人类化身在微妙的运动和复杂的情感中,已经被计算并投射到大屏幕上。
基本思想为我们提供了足够的机制来呈现数字光的分类,以帮助我们讨论本书中采用和未采用的道路。
Digital Light 世界中的第一个区别在于像素的起源。如果它是现实世界的样本,那么我们说它是被采取的。我们通过对现实世界进行采样并将结果数字化来从现实世界中获取这些像素。获取此类像素的一种常见方法是使用数码相机——例如手机中的相机。我们说我们拍摄这样的像素。无论我们是在拍摄快照、静态照片还是视频序列(对时间和空间进行采样),都是如此。
如果一个像素是从头开始创建的,那么我们就说它是制造的。制作像素的常用方法是使用数字计算机执行计算,并用计算结果填充像素。我们计算的像素与现实世界之间没有必要的联系。事实上,这些像素通常与奇幻世界相关联。
take 与 make 的区别与analytic和synthesis的区别相同。拍摄与计算的区别也是如此。
第一个区别将广阔的数字光世界分为两个主要子领域。分析部分有各种名称,我们将它们集中在一起,统称为图像处理。同样,合成的一半通常被称为计算机图形学。事实上,该领域的早期学术期刊被称为计算机图形和图像处理。为了站得住脚,这本书主要致力于计算机图形的“一半”。除了偶尔提及,它省略了图像处理。要了解在 Digital Light 中创建的空白有多大,请考虑以下省略一半的示例:所有使用手机拍摄的照片,任何您为您的孩子或宠物制作的视频、所有空间站和火星探测器视频、所有飓风和恶劣天气视频、所有在现实世界中拍摄的现场演员的现代电影、所有有线电视新闻节目(不包括高度合成的广告和徽标) ,所有间谍卫星图像,现代汽车倒车时的所有后视镜显示等等,都是分析数字光的例子。
但是数字光的这个分析(或拍摄)一半的像素遵循与合成(或制作)一半相同的规则。傅里叶的频率思想适用。Kotelnikov 的采样定理适用。像素和显示元素的区别是一样的。图像文件格式相同。显示设备相同。像素就是像素。数码灯是一回事。只有用于用有意义的位填充像素的方法不同。如果您了解像素的工作原理,那么您就掌握了ALL Digital Light。
由于实际书籍的空间有限,我进一步细分了合成计算机图形。区别是基于意图。如果主要目的是在现实世界中生成一个对象(例如汽车、房屋或烤面包机),我们将其称为计算机辅助设计(CAD)。如果意图是一张图片,而不是一个对象,那么我们就进入了面向图片的计算机图形学的世界(当很明显只有图片是意图时,通常简称为计算机图形学。)
正如我在第六章中所解释的那样,这两个子领域——CAD 和面向图片的计算机图形学——的历史高度交织在一起,并且有着共同的创始人。在考虑了这段重叠的早期历史之后,我不会在本书中进一步讨论 CAD,而是将这项任务留给其他人。但是,我们在本书中所说的关于像素的所有内容也同样适用于 CAD 像素。
随时间变化的视觉场景称为视觉流。这是一个平滑的模拟流程,因此需要同时使用傅立叶和 Kotelnikov 技术。这样我们就可以在时间和空间上对其进行采样。我们都熟悉常规时间样本:在电影和电视中,我们称它们为帧。
本书中整个数字光的主要路径是通过面向图片的计算机图形学的非实时分支。所以,定义“实时”很重要,即使只是为了限制它的表现。有两个概念向我们传达实时信息,因此我们必须区分它们。
第一个概念是时变视觉流中的下一帧是在单帧时间(时间样本之间的时间)内计算的。计算速度足够快,可以在时钟的下一个滴答声中渲染下一帧——例如,对于实时数字视频,每六十分之一秒。这是实时计时的。时钟实时计算机图形最常见的用途是视频游戏,或众所周知的电子游戏。稍后我会详细介绍它们。
实时的第二个概念是它的速度足以让与不断变化的图像交互的人看起来是瞬间的。这是交互式实时. 一个简单的例子是游标。用户在桌面上拖动鼠标,或在触摸板上拖动手指,同时观察光标在屏幕上的移动。只要人移动,屏幕就会通过将光标从其先前位置移开并将其置于其当前位置来更新。实时速度足以让我们相信光标与我们的鼠标或手指紧密相连。它完全由用户的动作解锁和控制。如果用户不移动,则不执行图像计算。交互式实时计算机图形的常见用途是在任何手机、平板电脑、笔记本电脑或台式计算机上的几乎任何应用程序的用户界面中。以及操作系统本身——比如 Windows 或 MacOS。当然,所有这些接口都是合成数字光的一部分。
数字电影是本书的主要范例。这是非实时计算机图形的一部分,机器可以根据需要进行计算以创建图片。实时计算电影需要在 24 秒内计算每一帧。而整部电影在90分钟左右。为了展示当今电影行业的不切实际,皮克斯电影需要几个月的时间来计算,并且单帧需要长达 30 小时。一年大约有 50 万分钟。将一年的计算量减少到 90 分钟的实时电影将需要四个数量级的加速 - 10,000 X。假设摩尔定律继续成立——这是一个非常大的假设——我们可以期待在 2040 年左右会有一部实时电影。
另一方面,计算机现在速度如此之快,以至于它们可以生成实时图片。这就是许多现代电子游戏所做的。此外,他们会根据游戏玩家在游戏时的输入来改变计算的内容。所以他们同时利用实时、时钟和交互式类型。这些图像不像电影那样逼真和复杂,但本书所追求的数字电影与视频游戏之间唯一真正的技术区别是可用的马力。关键是本书涵盖的内容也适用于游戏,尽管我并不专注于它们或它们特定的历史和英雄。
这本书中的一个特殊主题——称之为贯穿始终的主题和弦——涉及一种困扰技术突破的理念-混乱-暴君三重奏。我们首先在第一部分的三个“基本伟大创意”章节中了解主题是如何发挥作用的,其中每个三合会也与一个人联系在一起。然后是第二个主题,当我们发现接收到的技术历史经常充满错误时。在后面的部分中,我们将这两个主题应用于其他技术,因为它们与人群相关。
故事从法国革命家约瑟夫·傅立叶开始。在这种情况下,这个想法是傅立叶的伟大概念,即所有自然都是音乐。推动他的世界的混乱是法国大革命以及他随后与皇帝和国王的战斗。拿破仑是将傅立叶流放到以格勒诺布尔为中心的偏远部门的暴君,因此在不知不觉中为他提供了发展他的革命思想的空间。
在基本思想的第二章中,我们遇到了大多数美国人都不知道的俄罗斯人弗拉基米尔·科捷尔尼科夫。他采纳了傅立叶的伟大想法并在其上建立了自己的想法:伟大的采样定理是使数字光成为可能的微妙而美丽的想法。
这里的想法,在想法-混沌-暴君三元组中,是 Kotelnikov 的高度不明显的采样概念,即离散的、尖峰的样本可以准确地表示平滑的模拟连续体。他的混乱是影响世界历史进程的一系列战争,尤其是在俄罗斯——俄国革命、随后的内战、世界大战和冷战。他的暴君是斯大林的继任者马林科夫、克格勃的贝利亚,以及拥有古拉格集中营的苏联秘密机构。在 Kotelnikov 的案例中,他的保护者、Malenkov 的妻子 Valeriya Golubtsova 故意并一再保护他免受混乱,并在她的大学里给了他一个家。
采样定理是Kotelnikov 的想法。美国人被教导——我被教导——这是克劳德香农或哈里奈奎斯特的,但香农从未声称它和奈奎斯特从未说过。因此,我们看到流传下来的关于技术的故事往往是错误的,但仍然是我们所接受知识的一部分。在这种情况下,腐败的错误几乎可以肯定是民族主义,或者更普遍的政治。在冷战时期的美国,这么重要的想法怎么可能归功于苏联共产党?!尽可能准确地讲述每种技术的正确历史不仅可以检查而且还可以说明为什么存在“替代”版本。
数字光的第三个伟大的基本理念来自于数字世界著名的同性恋烈士艾伦·图灵。他独自创造了我们现在所知道的存储程序计算机、计算和编程的概念。他的混乱是二战,他的暴君是英国的《官方保密法》,一方面,当他因同性恋入狱时,他无法解释他在拯救国家方面的作用。(但错误有时会得到部分纠正。英国新发行的 50 英镑纸币将以图灵为特色,并于 2021 年进入发行阶段。)
图灵的故事与约翰·冯·诺依曼的故事相反。约翰尼惊人的智力使他成为世界上为数不多的了解和欣赏图灵所取得的成就的天才之一——存储程序计算机的发明。他把在世界上建造硬件计算机作为自己的职责——让图灵的想法快速发展——使用一种主导计算机工程数十年的简单架构。
图灵发明了编程的概念,冯诺依曼参与命名。他们都注意到编程或软件,而不是硬件,是计算的挑战。
计算机和电影这两种技术促成了数码光的发展。在本书的第二部分,我们将探讨其中包含的两种技术:计算机中的数字光本身和电影中的动画。计算机显然对 Digital Light 至关重要,我们发现它们与 Digital Light 的诞生密切相关。但电影也为 Digital Light 贡献了重要的结构和术语,尤其是数字电影。更重要的是,电影依赖于与 Digital Light 相同的基本采样理念。电影将采样从空间扩展到时间,并支持我们的论点,即采样是对现代世界的一项关键技术贡献。一种理论有助于解释这一切。
这两种高科技独立地展示了本书的“接受的历史是错误的”主题,尤其是通过它们奇怪的有缺陷的历史来呈现,并由每种技术的理念-混乱-暴君三元组所概述,并延伸到人群。
图灵发明的计算机有一个主要缺点:速度慢得令人难以忍受。他的机器可以计算皮克斯的玩具总动员,但这样做可能需要整个宇宙的生命。因此,图灵启动了一个项目来构建他的通用存储程序计算机的电子版本,以使其运行得更快。他引用了现在熟悉的经验法则:让软件快速运行,在硬件中实现它。换句话说,如果忽略速度,硬件和软件本质上是等价的。我强调这一点是因为现代历史学家在 1940 年代后期仍然将存储程序计算机的功劳归于硬件工程师,而图灵已经在他 1936 年的著名论文中描述并使用了这个概念。这是他证明普遍性的关键,因为我在第 3 章中展示了他的证明草图。
我们今天所说的计算机一词的含义正是:电子存储程序计算机。图灵走出数学界,在 1940 年代加入了一个名为 Pilot Ace 的项目,以建造第一台这样的计算机。他失败了,原因我在第四章中解释过,但其他人接受了这个想法。事实上,比赛正在进行中。几个团队争先恐后地制造了第一台机器,尤其是在美国和英国。
显而易见的是,第一台计算机的许多索赔人不符合条件。再一次,收到的故事是错误的。它当然不是美国的 Eniac,它不是存储程序计算机,也不是英国早期的 Colossus,也不是存储程序。通过仔细定义计算机,实际上可以列出前 10 台左右的计算机。根据电子存储程序计算机的定义,英国曼彻斯特的 Baby 是第一台计算机。它赢了,因为它拥有第一个成功的电子存储器。memory 和 Baby 是由英国工程师 Freddie Williams 和 Tom Kilburn 使用通常称为 Williams 管的解决方案创建的。尽管他没有设计或制造机器,但图灵很快就找到了通往 Baby 的道路。
与此同时,天才约翰·冯·诺依曼打算在美国制造一台计算机。他的团队与 RCA 实验室的 Vladimir Zworykin(已经以电视闻名)和他的团队签订了合同,以构建电子存储器。这段历史的简短版本是 Zworykin 团队未能及时让他们的记忆发挥作用。冯Neumann 团队听说了 Baby 的记忆解决方案 Williams 管,并立即采用了它。
冯·诺依曼分析了他能找到的每一台计算机或类似计算机的机器。他注意到,通过添加一些简单的硬件使其成为存储程序计算机,可以将 Eniac 转换为计算机。我将由此产生的新改进的 Eniac 称为 Eniac+。正如我所写,关于 Eniac+ 是否确实赢得了“第一台计算机”称号,存在学术争论。根据几乎任何“完整”的定义,这两台机器都是在几周之内诞生的,而记录的日期不同,让历史学家争论不休。
我在这本书中强调 Baby,因为它显示了第一个像素。威廉姆斯管在阴极射线管 (CRT) 的表面上存储位,一个短划线表示 1,一个点表示 0。这些是 Baby 的显示元素(或扩展像素)。它们排列成一个阵列。Kilburn 在 1947 年拍摄了这张我称之为 First Light 的照片,就在 Baby 于 1948 年完成之前。
由于这种第一台计算机/第一台光的巧合,第 4 章不仅是计算机的历史,也是早期数字光的历史。在那一章中,我开始阐述本书的另一个主题,即高科技几乎不会简化为对单个创造性天才的叙述。即使是对早期少数计算机的解释也需要引入我所谓的流程图或谱系图,即参与创建这些重要机器的人们的“家庭”。
但是,计算机的这段特殊历史是本书中唯一几乎符合单一创意天才模式的历史。图表的最顶端是艾伦·图灵。从图灵到第一台计算机 Baby 没有单一的直接路径。冯诺依曼和其他一些人也接近榜首。该图表显示了谁影响了谁,或多或少以正确的时间顺序显示。它展示了这些想法如何扩散并影响了早期的计算机。总结是图灵发明了计算机的概念——意思是存储程序计算机——而冯诺依曼帮助创建了允许工程师在硬件中实现图灵想法的架构。宝贝,事实上,尽管是在英国建造的,但它使用了冯诺依曼建筑。而冯诺依曼的美国团队采用了英国的记忆解决方案,威廉姆斯管,
在本章中介绍摩尔定律会带来一个易于在本书其余部分应用的公式:计算机的所有优点每五年会提高一个数量级。这使得摩尔定律的革命性意义,作为数字革命中令人敬畏的超新星发电站,比集成电路元件密度方面的通常表述更为明显。我建议这个神秘的“定律”衡量一个大在竞争中,当技术的改进没有最终的物理障碍并且技术必须按自己的方式付费时,一群,比如说成千上万的有创造力的人可以继续改进一项技术。
同时,流程图机制使早期计算机历史中的国际互动和竞争变得容易可视化。同一张图表让我们可视化了 Digital Light 的最早发展,因为所有第一次突破都发生在第一台计算机上。对本书特别重要的是,第一个流程图的一个分支自然而然地引出了第 6 章中的流程图。通过麻省理工学院的 Whirlwind 计算机,这个分支最终导致了现代计算机图形学。 Digital Light 中最早的图片——可能包括第一批动画。然后我们沿着这条线进入第 7 章及其流程图。
但首先我打断了 Digital Light 的流畅故事,介绍另一项影响数字电影的高科技。第 5 章是关于传统模拟电影的旧技术的简短总结。
当我准备写这本书时,我沮丧地注意到,我自己拥有 50 多年的电脑电影制作经验,无法告诉你是谁制造了第一台电脑或是谁发明了电影。我以为其他人也不能。在讲述技术历史时存在系统性缺陷,我开始理解这一点。我对这两种技术历史的解决方案是相同的:首先,仔细定义术语。其次,使用家谱方法而不是简单的叙述。
我刚刚讨论了这种方法对第一台计算机历史的影响。随着对计算机一词的良好定义,那里的大部分问题都消失了。当民族主义主张被打折以支持互动的创作者家庭时,剩下的问题就消失了。结果是一个易于理解的历史,其中包括主要参与者和地区。它还可以直接将数字光的突破分配给早期计算机创建的适当中心。当然,我不能声称绝对正确,但我确实声称这种方法为历史提供了一个易于纠正的结构。因此,在第 5 章中,我将同样的方法应用于电影。
就像我问过的几乎每个人一样,我认为电影是由托马斯·爱迪生、埃德沃德·迈布里奇或卢米埃尔兄弟创作的。但我不能告诉你是哪个。事实上,定义和流程图分析技术表明,电影不是由他们制作的。正确地说,他们都影响了正确的故事,但一些主要的创新者只是从流行的历史中消失了,或者从未被包括在内。对于美国的威廉·肯尼迪·劳里·迪克森来说尤其如此和法国的 Georges Demenÿ。但他们也不是单独行动的单身英雄。它需要流程图来表明谁与谁合作,谁偷了谁,谁背叛了谁,等等。它还可以透视不同的玩家。爱迪生在这些灯光下,给人的印象是一个从他支持的发明家那里窃取信用的暴君。迈布里奇被揭露为一个他没有实施的想法的优秀推销员。Lumière 兄弟的传奇圣徒身份因他们实际所做的细节的披露而受到影响。这是一个比我想象的要复杂得多的故事。
与计算机一样,将电影机器定义为相机、胶卷和投影仪的仔细定义是明确的概念。仅发明这三部曲中的一部分不足以作为电影发明的权利。看一下本章的流程图可以看出,不可能有简单的叙述来捕捉电影机器的历史。几乎没有什么可以有意义地简化。
从技术上讲,电影和动画章节允许我们在三维时间中练习采样定理,其中帧就是我们所说的视觉流样本。我开始这一章时相信我可以使用采样定理解释电影为什么会移动。但是我发现采样定理的解释并不完全正确。我们可以使用该定理制作一部理想的电影,但显然该解决方案尚未实施。我称之为“瞳孔外”的解释,即在光进入人眼之前传播样本(帧)。
相反,电影,甚至是数字电影,都使用将连续“帧”呈现给人眼的技术。这似乎可以通过“在瞳孔内”锻炼人脑的感知机制来发挥作用。也就是说,分离的帧直接提供给视网膜和大脑,后者将重建为平滑运动。我不想解释大脑的机制,但指出,从证据来看,它似乎在做类似于从样本中重建采样定理的事情。
电影章节还包括动画——尤其是角色动画——以及技术和人。沃尔特迪斯尼和经常被忽视的 Ub Iwerks 在本节中出现。建议是,经典动画师的挤压和拉伸、预期和夸张技巧是采样问题的直观解决方案。再次因为我在该领域工作了 50 多年,了解到早期考虑的替代二维动画系统,这让我个人感到非常惊讶。只有著名的 cel 动画系统才能进入现代世界。所以 cel 动画是 1980 年代中期“现称为皮克斯的团队”为迪士尼的计算机动画制作系统 (CAPS) 实施的动画技术。这是我们所知道的唯一技术。
这里的好主意是,如果在硬件中实现,图灵 1936 年的存储程序计算机想法可以快速运行。比赛开始了,从 1940 年代初开始。推动第一台计算机生产的混乱是希特勒和纳粹德国的崛起,以及对他们会在英国或美国之前达到生产原子弹的巨大恐惧。事实上,第一台计算机 Baby 是在希特勒和纳粹灭亡后的 1948 年完成的。但混乱仍在继续,因为苏俄迅速取代了德国作为生存敌人的角色,氢弹取代了原子弹成为最可怕的武器。早期的计算机用于武器计算和炸弹爆炸的模拟。
直接影响图灵和冯诺依曼的暴政是英国和美国各自的国家安全体系。特别是,英国的《官方保密法》实际上对追捕艾伦·图灵(Alan Turing),甚至可能导致他的死亡负责。
这项高科技的好主意是,在付费观众之前及时复制视觉流程是一件好事。这个想法本质上取决于一系列照片作为呈现视觉流动的方法。因此,它建立在 19 世纪中叶相对较新的静态摄影领域的基础上,并在其结束时,即 1895 年取得了第一个成果。
没有明显的外部混乱驱动电影的发展。如果我们希望将某些东西推广到那个水平,那么混乱就是纯粹的资本主义竞争冲向被认为是有利可图的新市场。
但是有一个明显的暴君,至少在美国方面。托马斯爱迪生很好地填补了这个角色。他建立了一个设备齐全的实验室,并邀请了热情的年轻发明家。他给了他们一个家和鼓励。麻烦的是,爱迪生随后声称他们所有的发明都是他自己的,他把所有的钱和名声都收入囊中。本书中最明显的例子是威廉·肯尼迪·劳里·迪克森的案例。迪克森今天鲜为人知,尽管他为爱迪生制造了相机,为传记制造了投影仪,并完善了成为电影界标准的 35 毫米穿孔胶片格式。
在法国方面,没有这么明显的暴君。但是关于卢米埃尔兄弟不仅相爱而且还一起发明电影的错误神话有一个专横地控制着法国人的想象力。事实是,兄弟俩互相刺伤对方,从乔治斯·德梅尼(Georges Demenÿ)等其他人那里汲取灵感,并在电影格式之战中输给了迪克森。
被称为动画电影的电影子领域是那些与现实世界时间脱节或精神错乱的电影。最初的想法是手绘框架可以形成娱乐的视觉流。如果我们再次愿意将竞争性资本主义提升为混乱,那么它的混乱与一般电影的混乱相同。暴君的角色由沃尔特·迪斯尼本人担任,他从热心的企业家转变为声称自己是公司和米老鼠的唯一发明者,或者至少让这种看法在公众心目中获得了未经纠正的基础。
本书的第三部分专门讨论数字光。我在三个章节(6、7 和 8)中使用面向图片的计算机图形作为骨架来讲述它的故事,涵盖摩尔定律之前(时期 1)和之后(时期 2)的发展。暂时,让我们回到第 4 章和 Digital Light 的黎明时刻,回忆一下我们在那里发现的东西。
第一个像素是在 70 多年前的 1947 年末,在注定要成为第一台显示设备的 CRT 上显示的。我称那第一张数码照片为 First Light。我们在第一台计算机 Baby 上找到它的像素,即第一个像素。黎明章节 (4) 涵盖了像素和计算机的起源。我已经总结了关于计算机的部分,所以现在我转到像素和图片部分。
1940年代后期出现了几张数码图片,1950年代初期出现了最早的互动游戏和动画。在这个早期阶段,用珍贵的计算机拍照通常被认为是轻浮的,不像核弹计算那样严肃。但不可能阻止对机器图片的推动。给定一个显示设备,人们只需要制作图片。即使花费数百万美元。
1950 年代初,麻省理工学院的 Whirlwind 发生了第一次与图片无关的时代的一致背离。许多早期的图片出现在这台电脑的版本上,可能包括第一个数字动画和早期的互动游戏,以及第一个 3D 图片(但没有透视图)。第 4 章的流程图将我们直接带入第 6 章的图表和 Digital Light 的兴起。
我们从计算机图形学中最可爱的形状之一——样条曲线开始第 6 章。这是一个优美的形状,掩盖了早期错误的信念,即计算机只能绘制刚性、块状、棱角分明的线性物体。事实证明,样条曲线可以用采样定理来解释!实际上,与采样定理相反。这让我们介绍另一位采样定理的发明者,英国人 Edmund Taylor Whittaker 爵士,他的工作比 Kotelnikov 的工作早了 18 年。他几乎拥有(相反的)采样定理,但“几乎”使他无法获得首要地位。因为他使用了与 Kotelnikov 不同的观点,所以他错过了完整定理的一个重要点(工程师称之为“带通”版本)。Kotelnikov 的观点是这样的:给定一个平滑、连续的信号,将其采样为离散样本,然后将样本重建——我们说,将它们传播——回到原始的连续实体中。Whittaker 的观点正好相反:给定一组离散数据点,找到一条通过它们的平滑连续曲线,准确预测哪些点可能合理地落在给定点之间。Whittaker 在给定数据点之间插入值的技术与我们所说的扩展样本并添加它们没有区别。但是,当科捷尔尼科夫正在重建一条给定的曲线时,惠特克正在构建或发明一条曲线。构建曲线上的点对他来说很重要,而不是曲线本身——数据而不是形状。给定一组离散数据点,找到一条通过它们的平滑连续曲线,准确预测哪些点可能合理地落在给定点之间。Whittaker 在给定数据点之间插入值的技术与我们所说的扩展样本并添加它们没有区别。但是,当科捷尔尼科夫正在重建一条给定的曲线时,惠特克正在构建或发明一条曲线。构建曲线上的点对他来说很重要,而不是曲线本身——数据而不是形状。给定一组离散数据点,找到一条通过它们的平滑连续曲线,准确预测哪些点可能合理地落在给定点之间。Whittaker 在给定数据点之间插入值的技术与我们所说的扩展样本并添加它们没有区别。但是,当科捷尔尼科夫正在重建一条给定的曲线时,惠特克正在构建或发明一条曲线。构建曲线上的点对他来说很重要,而不是曲线本身——数据而不是形状。但是,当科捷尔尼科夫正在重建一条给定的曲线时,惠特克正在构建或发明一条曲线。构建曲线上的点对他来说很重要,而不是曲线本身——数据而不是形状。但是,当科捷尔尼科夫正在重建一条给定的曲线时,惠特克正在构建或发明一条曲线。构建曲线上的点对他来说很重要,而不是曲线本身——数据而不是形状。
第 6 章剩下的大部分内容是关于用三角形建模 3D 形状。我讲述了一些最早的研究人员在后来成为计算机图形学方面的故事。最早的玩家,例如 Steven Coons 和 Pierre Bézier——以及几乎被遗忘的 Paul de Casteljau——对图片并不特别感兴趣。他们使用计算机雕刻木头或泡沫,或以其他方式计算实际物体——例如汽车车身或飞机机翼。因此,严格来说,他们是计算机辅助设计或 CAD 的先驱。但是在这个早期阶段,面向对象的 CAD 和面向图片的计算机图形学是一回事。两者的起点都是计算机内存中的几何模型。
计算机图形技术的故事通常以叙述方式讲述,其中有一个人 Ivan Sutherland,同时不连贯地向其他开国元勋致敬——以 Steven Coons 的名字命名该领域的最高奖项,或者命名一个特定的皮埃尔·贝塞尔之后的曲线。所以再一次,如果没有错误,收到的故事是不充分的。我在这里尝试使用另一个系谱流程图来尝试更令人信服和综合的历史,正如我所提到的,该流程图连接到第 4 章(黎明)的流程图。
使用这种技术,我取代了简单的叙述,即计算机图形始于 Sutherland 在 1962 年编写的 Sketchpad,具有更强大的网络Coons、Bézier 和来自汽车和飞机行业的被遗忘的 de Casteljau,以及三个经常被忽视的玩家,他们都逃脱了纳粹恐怖的贡献:被阿尔伯特·爱因斯坦救下的赫伯·弗里曼;Bertram Herzog,被 Kindertransport 计划拯救;还有马塞利·韦恩,他的父亲在辛德勒的名单上。
伊万·萨瑟兰仍然是一个主要参与者,但与由他自己、蒂姆·约翰逊和拉里·罗伯茨组成的 MIT 同学三巨头共同担任创始角色。事实上,萨瑟兰给了我们第一个交互式渲染二维图形系统,称为Sketchpad。大约在同一时间,Sutherland 的同学(也很像)Tim Johnson 为我们提供了第一个交互式渲染的三维系统,称为 Sketchpad III——三维的 III,而不是版本号。这显然是任何类型的第一个交互式三维系统,尽管通用汽车公司的三维 DAC-1 系统大约在同一时间可用。Sketchpad III 在透视的使用上绝对超过了 DAC-1,它采用了 Triumvirate 中的第三位同学拉里·罗伯茨 (Larry Roberts) 设计的方法,这种方法至今仍在使用。
Sutherland 和 Roberts 以及来自新机构 NASA 的 Robert Taylor 成为另一个新机构 ARPA(现称为 DARPA)的连续资助者。该行业的大部分早期资金来自 NASA 和 ARPA。Sutherland 随后与 David Evans 一起创立了 Evans & Sutherland 计算机图形设备供应商,同时也是犹他大学著名的计算机图形系,该领域的许多未来领导者都在那里接受了培训。泰勒随后创立了著名的计算机实验室施乐帕洛阿尔托研究中心(PARC)。罗伯茨继续帮助启动互联网。
本章的想法是,由虚构对象构成的虚构世界的内部模型可以渲染成二维图片。这一时期的破坏性混乱是苏联的核威胁和太空竞赛。暴政_是国家安全系统。这一时期的辉煌是美国完全放弃了资本主义原则,以便更快地为可能的核攻击做好准备。有远见的年轻天才们在没有竞标的情况下迅速发放了大量资金——尤其是来自两个新成立的机构,ARPA 和 NASA。这是一场豪赌,但收获颇丰。它这样做的一种方法是加速数字光的发展,这两个机构都做出了贡献——这一章中的 ARPA,下一章(阴影)中的 NASA。
另一种完全的力量,即艺术界,开始出现在这里的数码之光故事中。本章强调 Digital Light 贡献者与开创性艺术世界事件之间的密切联系,例如著名的Cybernetic Serendipity书籍和展览。艺术界和科技界都小心翼翼地互相关注从这里开始,两人都意识到了绘画艺术中的一些新事物。他们的联系一直持续到今天。
第 6 章中的黑白线条图在第 7 章中推进到彩色表面渲染——从形状到阴影。事实上,摩尔定律以及 Epoch 2 计算机和电路实现的计算机放大技术的爆炸式增长使所有这些颜色成为可能:从 1967 年的第一个彩色像素到电影——第一部完全数字电影——在1970年代后期。和以前一样,本章的流程图是上一章图表的延续。这一章的复杂性促使我将其分为三个步骤或部分,由相应的摩尔定律功率因数命名,从 1X到 10X到 100 X。
第 1 步(摩尔定律 1 X)是关于第一个颜色像素的创建。它们出现在何时何地?Gene Youngblood 于 1970 年撰写的媒体艺术经典著作Expanded Cinema意外地为解开这个谜团提供了线索。滋生地原来是阿波罗登月。我们确定通用电气工程师 Rod Rougelot 和 Bob Schumacker 在设计 NASA Apollo 模拟器时展示了第一个渲染颜色。那是 1967 年,他们利用摩尔定律的第一批成果来做到这一点。我们了解将几何图形渲染为彩色像素的含义以及如何做到这一点。
第 2 步(摩尔定律 10 X)涵盖 Xerox PARC、犹他大学和康奈尔大学的早期数字光。PARC 是 ARPA 和 NASA 的后裔。犹他大学计算机图形学起源于 ARPA。康奈尔大学是通用电气的鲁杰洛特和舒马克的后裔,是在帐篷里与唐格林伯格的一次偶然相遇。PARC 拥有世界上第一个通用彩色像素和第一个完全抗锯齿的像素渲染。但施乐决定不追求色彩。来自犹他州和康奈尔大学的学生负责第一个 3D 渲染计算机动画——康奈尔大学的彩色动画。在本节中,我将介绍元素渲染技术:纹理映射、着色模型和部分透明度等。
第 3 步(摩尔定律 100 X)介绍了纽约理工学院 (NYIT),该学院由长岛的特殊亚历山大·舒尔 (Alexander Schure) 领导。他幻想自己是沃尔特迪斯尼的继承人,并且是第一个在数字电影上投入巨资的金融家。他失去了一切,但在施乐 PARC 的“毕业生”和犹他大学的毕业生聚集在一起并组成后来成为皮克斯的团队之前,他失去了一切。电影——第一部完全由计算机生成的故事片——的愿景在这里首次形成。我在本节中解释了二维动画比三维动画更难,并介绍了最重要的 Alpha 通道。
摩尔定律的持续爆发驱使我们进入第 8 章,了解千禧年的电影本身——以及电影所象征的数字大融合。计算机图形现在让位于数字电影。当我介绍摩尔定律从 1,000X到 10,000,000的改进时X,我再次将它们细分为摩尔定律数量级的步骤。
第 4 步(摩尔定律 1,000 X)是关于卢卡斯影业的,由乔治卢卡斯在加利福尼亚州马林县创立。纽约理工学院的小组目睹了 Schure 与Tubby the Tuba (1975) 的失败。另一方面,卢卡斯是突破性特效电影《星球大战》的成功制片人(1977 年)。因此,1980 年,当他向他招手时,其中一些人高兴地跳到加利福尼亚与他一起工作。在这里,该团队首次在大银幕上曝光,与迪士尼公司签订合同,将经典的 cel 动画数字化,并聘请了第一位伟大的动画师。一家日本公司接洽该团队制作第一部电影,但众所周知,由于摩尔定律的力量不足,Monkey 项目未能实现。然后乔治和玛西娅卢卡斯离婚了,这让卢卡斯无法支持这个团队,并导致了皮克斯的衍生公司。一项主要的技术进步是从一堆渲染技术飞跃到一种用于表达无限量的语言——一种着色语言。另一种是有效处理运动模糊的突破性方法,对三维动画的发展至关重要。事实上,第一个 3D 角色动画出现了。几乎与 Lucasfilm 集团同时,Pacific Data Images (PDI) 和 Mathematical Applications Group Inc. (MAGI) 也开发了角色动画。
第 5 步(摩尔定律 10,000 X–10,000,000 X)是关于第一部数字电影的创作。第一个是皮克斯的玩具总动员(1995 年),该公司于 1986 年从卢卡斯影业分拆出来。第二个是梦工厂动画公司,从 PDI 中分离出来,名为Antz(1998 年)。蓝天,第一批数字电影公司中的第三家,出自 MAGI,很快制作了冰河世纪(2002)。这三部电影是千禧年的多彩标记,也是数字大融合终于发生的标志。相应的流程图显示了这些早期数字工作室如何共享许多通用流程。
这本书的最后一个想法-混乱-暴君三合会始于创造第一部数字电影的好主意。推动它的混乱是摩尔定律造成的巨大破坏。有几个暴君,最明显的是皮克斯的史蒂夫乔布斯。他的钱使公司得以存在,但实际上,他后来声称皮克斯和电影是他的想法,并拿走了大部分钱,更不用说功劳了。出于所有错误的以自我为中心的原因,他继续支持皮克斯度过了最艰难的日子,但效果与他分享了我们的愿景一样。忠实于暴虐的形式,他无意中创造了一个财务保护的空间,我们可以在其中生存以实现我们的愿景。
在没有评论或通知的情况下,1960 年代的计算机图形学社区采用了 Triumvirate 隐含实践的中心法则——蒂姆·约翰逊和拉里·罗伯茨在 1963 年的 Sketchpad III 中使用它,1968 年伊万·萨瑟兰 (Ivan Sutherland) 加入了他的头戴式显示器。正如最初的中心法则所规定的那样:图片应基于由欧几里得几何构建的三维模型,并以文艺复兴时期的视角在二维中观察。这是一个教条,因为计算机或计算并没有强迫这些选择。从抽象的几何图案到表现主义的飞溅,整个绘画世界都可以在计算机上实现。然而,计算机图形学主线尊重教条。
在 1960 年代后期,当彩色计算机图形成为可能时,中心法则悄悄地扩展到包括牛顿物理学,这也是计算机不需要的。这种完整的“交响乐形式”是当今数字电影、VR(虚拟现实)、视频游戏、飞行模拟器等领域中的一种。这里是简明扼要的总结:
中心法则=欧几里得模型、文艺复兴观点、牛顿物理学。
尽管高度结构化,但这种形式承认惊人的奇幻创造力,这从千禧年和千禧年以来制作的任何数字电影列表中都可以清楚地看出。但是中央教条形式之外的数字光的巨大子空间需要探索。绘画程序是早期不受中心法则约束的最明显的数码光创意工具。
请注意,在 Digital Light 的分析、图像处理部分,中心法则不是教条。就是这样。这就是现实世界的实际运作方式。至少它代表了人类规模的正常现实世界的最佳模型。
另请注意,根据定义,CAD 受制于中心法则。它的对象必须存在于现实世界中并经受住物理测试才能在那个牛顿世界中使用。正是计算机图形学与 CAD 的共同历史根源使得中心法则对于面向图片的计算机图形学也显得如此自然且不言而喻。
计算机视觉人员喜欢说他们所做的与计算机图形学相反。他们的意思是,大脑从二维视网膜输入中生成我们感知的三维内部模型。他们实际上的意思是,大脑做的与受中心法则支配的计算机图形部分相反。
到目前为止,我在这个结局中所写的内容总结了这本书以及 Digital Light 到千年的发展。但现在已经过去了 20 年,在此期间,不断爆发的摩尔定律推动了数字光领域更令人惊叹的进步。我在以下几节中只勾勒出其中的一些发展。
在现代虚拟现实 (VR) 中,根据用户输入(例如头部位置)实时生成一对立体图像(每只眼睛一个)。用户佩戴一副特殊的护目镜或眼镜。实时执行大量计算并不容易,需要付出很多特别的努力。但回想一下经验法则:如果您希望计算速度更快,请使用专用硬件。算法相同,但由硬件加速。换句话说,在硬件的帮助下,与制作电影相同的技术正在被用于创建 VR。理解电影像素在很大程度上解释了 VR 像素。硬件支持有时只不过是您的手机提供的。(就上下文而言,iPhone 于 2007 年推出,Android 系统于 2008 年推出,就在昨天。)
阴影章节中的流程图自然地延伸到了对 VR 的讨论中。梦工厂动画公司的动画师 Eric Darnell 与 Maureen Fan(作为 CEO)在硅谷共同创立了一家 VR 公司 Baobab Studios。公司中的一些人,例如拉里·卡特勒(作为首席技术官),是梦工厂和皮克斯的毕业生。梦工厂的格伦恩蒂斯、迪士尼的格伦基恩和皮克斯的我都是这家初创公司的顾问。Baobab 已经在 VR 中创建并制作了多个获奖角色动画。同样,来自视觉效果工作室和游戏公司的许多人现在都在创建 VR 内容。
目前对数字光感兴趣的是增强现实 (AR),其中合成图片与现实世界实时结合。一般来说,这是拍摄和制作数码光的组合。现实世界是实时数字化的。AR设备实时合成一个虚构的世界,并将其像素与现实世界的像素相结合,创造一种全新的视觉体验。在最简单的情况下,这只是合成场景在真实场景上的简单叠加,使用 Alpha 通道。现实世界只是合成前景的二维背景。事实上,有时现实世界根本没有数字化。它只是简单地通过并与护目镜或眼镜内的合成图像进行光学组合。
艺术家 Darcy Gerbarg 最近一直在使用 AR 探索 Digital Light 的边缘。她的作品说明了本书的类别。她的主要工具是 Google 的 TiltBrush,一款 VR 应用程序,以及 Adobe 的 Photoshop,一款经典的二维像素应用程序。倾斜画笔允许画家使用符合中心教条的笔触在三个维度上进行绘画。它们以欧几里得几何建模,凹凸贴图看起来像笔画,根据牛顿物理学投射阴影,并以文艺复兴时期的视角观看。但随后她使用手机中的特殊程序将 VR 绘画笔触与来自现实世界的图像结合起来。换句话说,她在移动时从选定的视点看到她的 3D VR 绘画笔触,叠加在她工作室的二维手机图像上。然后她将这些 AR 场景的选择带入 Photoshop,并按照她的艺术意愿创造性地改变像素的内容。她的作品以一种全新而有力的方式将你拉入二维空间,2
在数字光的当前极端是一个更复杂的案例——通常称为混合现实 (MR),以强调它与简单 AR 的区别:计算机从现实世界中推导出三维结构,因此合成世界似乎与它——比如说,一种合成动物在现实世界的桌面上令人信服地行走。这类似于我们的大脑必须做的事情——计算机图形学的反面,当然受制于中心法则。在 AR 中,只有真实世界和合成世界相结合。在 MR 中,创意空间结合在一起——两个世界的内部模型交织在一起。
图 9.2
充满活力的乐队-TL2-205552D2eC2,© Darcy Gerbarg,2018。
正如我所写(在 2020 年),MR 有几种技术方法:微软正在追求其 HoloLens 设备,而 Magic Leap 是一种直接到视网膜的方法。我们等待这些非凡的设备和其他设备的成熟。请注意,它们似乎分别代表了瞳孔外和瞳孔内的解决方案,使用了本书电影和动画章节中的术语。瞳孔代表了我们大脑外部和内部发生的事情之间的硬边界。3
在我们等待期间,有关 MR 的技术问题比比皆是。现实世界的对象会隐藏计算对象吗?并在他们身上投下阴影?计算对象会通过透明的现实世界对象显示吗?现实世界的光源会改变计算对象的阴影吗?我在 Siggraph 2019 上问过的专家向我保证,其中一些问题已经得到解答,但仍然是商业机密。两个世界的真正混合似乎是一个令人生畏的问题。它是拍摄和制作、拍摄和计算的完全整合,是计算机图形学和逆向计算机图形学的综合,两者都受制于中心法则。当然,这是一个足以激发一代计算机图形学家(如果不是神经科学家和科幻小说作者)和艺术家的问题。
一个新术语刚刚演变为容纳这可能发生的许多可能方向。它被称为扩展现实的 XR,适用于真实和虚拟环境的任何混合。
皮克斯人在 1996 年获得了技术学院奖,这是多年来的众多奖项之一。技术奖项在与电视转播的奥斯卡颁奖典礼一样迷人的颁奖典礼上颁发——同样的燕尾服和礼服、豪华轿车和电影明星、华丽的宴会和限时的获奖感言。但没有广播电视工作人员,也没有红地毯采访。电影艺术与科学学院理所当然地感觉到,公众可能对地面烟雾机或蜘蛛网发生器不感兴趣,这是我多年来亲眼目睹的两项技术奖项。
该活动总是由电影明星主持。1996 年是理查德·德莱福斯(Richard Dreyfuss),他因许多角色而闻名,尤其是乔治·卢卡斯 (George Lucas) 的美国涂鸦(1973) 中的柯特。Ed Catmull 和我与 Pixarians 坐在一张桌子旁,等待获奖。几个月前, 《玩具总动员》的首次亮相就轰动一时。4
Dreyfuss 从关于演员和技术人员如何相互依赖以及另一个非电视奥斯卡颁奖典礼对像他这样的演员的重要性的礼仪演讲开始。“我们演员和技术人员正在共同迈向未来,”他说。但随后他又增加了一个转折点。他看着我们的桌子并说:“请注意,皮克斯的人,我一起说的!” 观众席间传来一阵紧张的窃笑声。那里的演员显然一直在听我所在行业的同事过于油嘴滑舌的说法,“现在任何一天,我们都会用模拟代替演员。”
2000 年,我受邀为《科学美国人》杂志写一篇关于这个主题的文章——更换演员的可能性。然后我写的东西强调了一些我们还无法解释的人的特别之处——甚至一点也解释不了。5
我在这里称其为创造力,但这是一个不精确的术语。我想到的是图灵、科特尔尼科夫和傅立叶所做的,程序员、工程师和建模师所做的,以及动画师和演员所做的。
这就是图灵在发明计算和存储程序计算机时所做的,看似无中生有。这是创造力的惊人飞跃,是有史以来最伟大的飞跃之一。这是理论多样性的技术创造力——来自象牙塔。Kotelnikov 也用采样定理做到了这一点,这是另一个伟大的创造性飞跃。而且,当然,傅立叶的好主意是科捷尔尼科夫跳出来建造他的。
当程序员从一长串无意义的计算机指令中构建一个程序来做一些有意义的事情——比如计算玩具总动员时,这就是程序员所做的,或者使他们能够做到这一点的原因。那是技术创造力,工程多样性——来自我在这里所说的臭味。正如摩尔定律所描述的,不断创造出速度极快的计算机是这种多样性的另一个例子。另一个是使用几何和着色语言构建复杂的角色内部模型。
当动画师让我们相信一堆三角形是有意识的并且感到痛苦时,动画师会这样做——这是对精心制作的角色的启发。这就是艺术创造力。演员们也有它,让我们相信他们的身体所承载的思想属于与他们完全不同的人。事实上,演员和动画师认为这是相同的技能。如前所述,皮克斯根据动画师的表现来雇佣动画师。
我在 2000 年写的内容在 20 年后的今天仍然有效:我们不知道如何更换演员。但是我们可以替换演员的外表。代表演员的屏幕外观称为头像。我们可以用令人信服的化身代替银幕上的演员——即使是情感特写。我知道这一点,因为它已经完成了。在《本杰明·巴顿奇事》 (2008 年)中有布拉德·皮特的镜头,其中布拉德·皮特不是布拉德·皮特,而是他的化身——他外表的数字表示。关键是化身是由一位伟大的演员“驱动”的,即布拉德皮特本人。他和他的技能没有被取代。只有他的屏幕外观是。令人信服的细微差别是他的,而不是某些计算机程序的。6
这是我在 2000 年的预测——只要人类演员的化身被那些特殊的人叫做演员。我在Benjamin Button的存在证明之前八年通过计算机动画的持续发展进行推断,做出了预测。
动画师的技能与演员的技能基本上没有区别,除了用于表达的媒介——演员的人体或动画师的三角形。它们都让我们相信内心的生活,事实上,不是演员或动画师在实践他或她的艺术。正如我们在第 8 章中看到的那样,到千禧年为止,至少有三部电脑动画电影向我们展示了动画三角形在被称为动画师的创作者操纵时具有内在生命。那一年我实现的飞跃是,根据摩尔定律的奇迹,人物的真实感将无情地增加,达到令人信服地代表人类外表的程度。卡通化身将向现实化身发展。让我们相信他们的内心生活仍然是动画师和演员“驱使他们”的独特工作。
我在 2000 年挥手建议,因为我们花了 20 年的时间从 1975 年的电脑动画电影的想法到 1995 年的真实电影,也许还需要 20 年才能实现第一部无相机——但不是无演员——电影。所以 2020 年实际上已经到来,因为我对本章进行了最后的编辑,这清楚地表明我的挥手只是那个。没有证据表明一部情感上有效的无相机电影,只有人类化身,没有可见的人类。当然,没有证据表明演员或动画师被计算机模拟所取代。Richard Dreyfuss 可以在可预见的未来放松一下。
但 。. . 2020 年的进步暗示了一些不同的事情。考虑最近的电影《爱尔兰人》(2019)。每个伟大的七十多岁的人罗伯特·德尼罗、乔·佩西和阿尔·帕西诺都扮演着年轻的自己。这种“去老化”介于使用数码相机拍摄电影和使用计算机图形制作电影之间。而且它远非无摄像头。取而代之的是一个精心制作的摄像机(实际上是三个摄像机)用于记录演员的表演,就像在经典电影制作中一样。它们不受早期尝试渲染演员化身时使用的点或其他特殊标记的影响。然后数字艺术家使用复杂的、最先进的软件接管,仔细地将每个演员的真实面孔转换成令人信服的年轻自我代表。德尼罗的化身是年轻的德尼罗。它是由德尼罗本人推动的。数字艺术家将渲染复杂头像的缓慢过程称为“烘焙”。所以,7
不过,请注意:这些奇妙的欺骗性艺术进步可能会被不择手段的人用来对付我们。这种对人的虚假陈述被称为深度伪造,并且已经被部署。8
像素,一种看似简单但微妙的设备,将所有数字图片制作和拍摄结合到一个领域,即数字光,其中几乎包含所有现代图片。只需直观地介绍三个伟大的基本思想即可轻松理解数字光:傅里叶波、Kotelnikov 样本和图灵计算。
与数字光相关的两项基础高科技——计算机和电影——都在直观的层面上进行了处理。计算机显然是任何“数字”的基础。电影也是因为它们运用了采样定理,而 Digital Light 从它们那里继承了术语和概念。在本书中,我直接记录了这两种技术的历史。显示这种历史的更好方法是作为许多人的家谱流程图。这与以一个英雄人物为主角的引人入胜的叙述大不相同,后者非常受欢迎,但经常歪曲事实。这本书的灵魂在于这些图表所代表的“家庭”故事,包括所有通常的庆祝和争吵、合作和竞争、高尚和邪恶的人际关系。
在所有这些基础思想和高科技的历史中,一个重复的主题是思想-混乱-暴君三元组:一个伟大的想法,一个需要或推动其实施的混乱或破坏,以及一个暴君或其他形式的暴政,通常为错误的原因,创作者们为实现这个想法而苦苦挣扎。
随着本书的进行,鼓声变得越来越响亮,然后随着它到达最后一章而变得震耳欲聋和确定。这是摩尔定律所描述的每五年一次的常规数量级的额外功率爆发。我密切关注这颗爆炸的超新星,这是我们几乎无法理解的革命性发展。它扩展了我们作为人类的数量级限制。它放大了我们。Digital Light 只是其耀眼的成就之一。
任何简单到可以理解的系统都不会复杂到可以智能地运行,而任何复杂到可以智能地运行的系统将太复杂而无法理解。
——乔治·戴森,人工智能第三定律,Analogia 9
几年前,我妻子在剑桥大学国王学院休假期间,约翰·布朗斯基尔(John Bronskill)找到了我——艾伦·图灵(Alan Turing)在那里完成了他的开创性的工作。Bronskill 让我大吃一惊:“Alvy,我们不必再编程了!” 他因为 Adobe Photoshop 编写扩展而出名,这可能是专业领域中最受欢迎的像素应用程序。
“你是什么意思?”
“读这个,”他边说边把一份科学论文塞到我手里。它来自加州大学伯克利分校的人工智能研究实验室。该论文描述了一个特定种类的神经网络,该网络使用 1000 张未标记和任意的马照片以及 1000 张未标记和任意的斑马照片进行训练。马的照片包含任意数量的各种颜色的马,任意排列。当然,虽然斑马颜色没有变化,但斑马照片很相似。所有这些照片都是数字的,包括像素。经过适当的训练(我不会描述),网络可以完成以下惊人的壮举:呈现任意斑马照片,经过训练的网络将返回相同的照片,但每只斑马都被替换为马(图 9.3,上对)。(实际上,每匹斑马都有马色版本,反之亦然,每匹马都被自己的斑马条纹版本所取代。)
“它是如何工作的?” 我问道,并补充说:“我认为这个问题甚至没有明确定义。” 什么是计算机的马?什么是斑马?你如何将一个映射到另一个?
约翰只是忽略了这些观察:“我不知道。没有人会。它就是这样做的!逆向工程太难了。”
同一个神经网络做了其他惊人的事情。在风景照片和文森特梵高的画作上训练,它会接收任意一张风景照片并输出一幅文森特风格的画作。或相反亦然。或者以莫奈的风格。或者它将夏季景观转换为冬季景观。或相反亦然。
我本着“Digital Light 的下一步是什么?”的精神提到这一点。我承认我不明白这里发生了什么,或者从长远来看它是否重要。但让我们考虑一下。
图灵允许他的存储程序或通用图灵机在其程序上进行计算,就好像它是数据一样。这正是他发明的存储程序计算机所允许的。马到斑马的计算是程序计算的一个例子吗?图灵对这种可能性和人工智能特别着迷。就上下文而言,现代计算机的操作系统通常不允许对程序进行计算,因为它很容易造成破坏。
神经网络是在普通计算机上模拟的,因此不会计算进行模拟的程序。但是假设神经网络是一个实际的神经网络,而不仅仅是一个模拟。可以理解为在自己的程序上进行计算吗?我相信如此。我们自己的大脑显然是一个神经网络,据我们所知,其中没有与数据存储分开的程序存储。除了图灵计算之外,它可能没有做任何事情。在 80 年的概念经验之后,我们还没有发现任何仔细的过程。
图 9.3
1965 年,我开始在斯坦福大学攻读研究生,因为它是(我所知道的)提供名为人工智能的迷人新学科的两所大学之一——如今通常缩写为 AI。麻省理工学院是另一个。我从斯坦福大学的人工智能创始人约翰麦卡锡那里学到了东西。我与麻省理工学院的另一位创始人马文·明斯基进行了几次有影响的讨论。
几年后,我退出了人工智能,并决定在我的有生之年不会发生这种情况。考虑到我可能还有二十年的时间,这可能是一个过早的结论,但与此同时,我帮助制作了第一部数字电影。完成这些后,我现在有时间重新思考人工智能。事实上,我从未停止过这样做。
约翰·布朗斯基尔的话让我措手不及。我一直认为,当人工智能最终被解释时,我就能理解这个解释。然而,这里有一个机器学习的例子——可能还不够先进,还不能被称为人工智能——我无法理解。是因为网络在自己的程序上计算吗?我们知道,一般来说,我们甚至无法判断程序是否会停止这样简单的事情,所以我们无法弄清楚这个斑马马程序做了什么也就不足为奇了。
就其价值而言,从马到斑马的过程并不完美。Bronskill 向我展示的论文中展示的一个示例将弗拉基米尔·普京 (Vladimir Putin) 赤膊骑在马背上的著名照片作为输入。输出是普京和他的马融合成一个双头斑马条纹半人马(图 9.4)。10
当前革命的本质是我们无法预测它超过一个数量级。我们只需要乘风破浪,看看接下来会带我们去什么令人兴奋甚至神秘的地方。
图 9.4
我们在这里做了什么?我们用一个抽象的数学对象代替了一张图片,并用它打开了一个广阔的新想象领域。该对象令人不安地重复和离散,它的每个位点都在等待应用它自己的无限小斑点。但从它而来的是世界的所有图片,或世界。我以伊塔洛·卡尔维诺(Italo Calvino)的小说《看不见的城市》( Invisible Cities)中的一段作为结尾,其中作者想象年轻的探险家马可·波罗向年迈的蒙古皇帝忽必烈描述他在尤多西亚城发现了一块魔毯。这是一场介于真实与再现之间的对话:
欧多克西亚上下延伸,蜿蜒的小巷、台阶、死胡同、小屋,保留了一块地毯,您可以在其中观察城市的真实面貌。乍一看,似乎没有什么比 Eudoxia 更像地毯的设计了,以对称的动机布置,其图案沿着直线和圆形重复,与色彩鲜艳的尖顶交织在一起,在整个纬线上都可以遵循这种重复。但是如果你停下来仔细观察,你会相信地毯上的每个地方都对应着城市中的一个地方,城市中的所有东西都包含在设计中,按照它们的真实关系排列,这一切都逃不过你的眼睛。被喧嚣、人群、推搡弄得心烦意乱。欧多西亚的所有困惑,骡子的叫声,油烟的污渍,鱼腥味是你掌握的不完整视角中明显的东西;但地毯证明了城市在某一点上显示出它的真实比例,几何图案隐含在它的每一个最微小的细节中。. . . 一位神谕被问及地毯和城市这样不同的两个物体之间的神秘联系。两个物体中的一个——神谕回答——具有众神赋予星空的形状和世界旋转的轨道;另一个是近似反映,就像每个人类创造一样。一位神谕被问及地毯和城市这样不同的两个物体之间的神秘联系。两个物体中的一个——神谕回答——具有众神赋予星空的形状和世界旋转的轨道;另一个是近似反映,就像每个人类创造一样。一位神谕被问及地毯和城市这样不同的两个物体之间的神秘联系。两个物体中的一个——神谕回答——具有众神赋予星空的形状和世界旋转的轨道;另一个是近似反映,就像每个人类创造一样。
——伊塔洛·卡尔维诺,《看不见的城市》11
我最深切地感谢艾莉森·戈普尼克(Alison Gopnik),我的妻子、同伴和帮助会面。十年前,她从一开始就鼓励我写这本书,然后开始教我如何去做。我热切地听她说,因为她写了几本畅销书。“解开那些句子”是一个早期的指导,观察到我的学术句子大约有五个正常的句子。她的另一条指导智慧是:“至少要经过 50 次编辑,这些词才能开始呈现出它们从你的潜意识中自然流畅地流出的样子。” 我没有为“离开”十年而向配偶道歉,我要衷心感谢我让我与她分享写作的世界——其中的快乐和磨难。
我对芭芭拉·罗伯逊表示了另一种深切的感谢。芭芭拉在计算机图形学界享有数十年的获奖报道。在这本书的多年酝酿过程中,她一直是我的第一编辑。除了艾莉森之外,她是世界上少数几个可以自由批评我的作品的人之一,她知道我会善意地接受她的评论——如果可能是脾气暴躁的话——并采取行动。芭芭拉惯用的诡计是“建议”对我的句子进行简单的重新排列。几乎在所有情况下,她的重新排列都比我原来的效果更好。这些话仍然是我的,但更好。流程更流畅,逻辑更清晰,节奏更快。芭芭拉在我的计算机图形职业生涯的大部分时间里都是我的朋友,我们的友谊以这种方式得以幸存。的确,
在这里,我挑选出几个人,他们就本书涵盖的各种主题提供了特殊的、有时是至关重要的帮助:
名片通用图灵机和解释,基于第 3 章(图灵)的部分内容,作为旨在欢迎他们的On the Same Page活动的一部分,已于 2013 年提供给所有进入加州大学伯克利分校的新生。向每个新生(大约 8,000 人)赠送了一张名片图灵机的卡片纸实现,并附有一个乔治戴森的副本,图灵大教堂:数字宇宙的起源(纽约:万神殿书籍,2012 年)。
史密斯,阿尔维·雷。“A Taxonomy and Genealogy of Digital Light-Based Technologies”,Sean Cubitt、Daniel Palmer 和 Nathaniel Tkacz 编辑的第 1 章,Digital Light(伦敦:开放人文出版社,2015 年)。这篇论文于 2011 年 3 月在墨尔本发表,是本书的起源。
史密斯,阿尔维·雷。“他的正义沙漠:对四本图灵书的评论” ,美国数学会通告,第61 期,不。8 (2014): 891–895。基于第 3 章(图灵)的部分内容。
史密斯,阿尔维·雷。“数字光的黎明”,IEEE 计算历史年鉴38,第 3 期。4 (2016): 74–91。第 4 章(黎明)的学术介绍。
史密斯,阿尔维·雷。“电影为什么会动?” 在约翰·布罗克曼编着的《这解释了一切:世界如何运作的深刻、美丽和优雅的理论》(纽约:Harper Perennial,2013 年),269–272。基于第 5 章(电影)的部分内容。
史密斯,阿尔维·雷。“皮克斯如何利用摩尔定律预测未来”,《连线》,2013 年 4 月 17 日,https://www.wired.com/2013/04/how-pixar-used-moores-law-to-predict-the -future/,2020 年 4 月 13 日访问。基于第 6 章(形状)的部分内容。
除非另有说明,否则电子邮件将发送给作者。
引文中使用的缩写:
1 . Henri Breuil 和 Hugo Obermaier,西班牙 Santillana del Mar 的阿尔塔米拉洞穴(马德里:Junta de las Cuevas de Altamira,美国西班牙裔社会和历史学院,1935 年),图板 XLV。
2 . Appletons 的美国传记百科全书,6 卷,由 James Grant Wilson 和 John Fiske 编辑(纽约:D. Appleton and Company,1887 年),1:311–312。
3 . 这本书在http://alvyray.com/DigitalLight/上在线进行了完整的注释。注释按页码组织,然后键入每个段落的前三个单词,我为此提供了附加信息、源材料或数学文档。
1 . 维克多·雨果,《悲惨世界》(波士顿:小布朗,1887 年),192。
2 . 查尔斯·珀西·斯诺(Charles Percy Snow),“两种文化”,《两种文化与科学革命:重演讲座》,1959 年(纽约:剑桥大学出版社,1961 年),1-21。
3 . Ronald N. Bracewell,傅立叶变换及其应用(纽约:McGraw-Hill,1965 年);Jacques-Joseph Champollion-Figeac, Fourier et Napoleon, l'Egypte et les Cent Jours (Paris: 1844); Victor Cousin,Note Biographiques pour Faire Suite a l'Éloge de M. Fourier(巴黎:1831);Jean Dhombres 和 Jean-Bernard Robert, Joseph Fourier, 1768–1830: Créateur de la Physique-Mathematique (巴黎: Belin, 1998); Enrique A. González-Velasco,傅里叶分析和边值问题(圣地亚哥:学术出版社,1995 年);Ivor Grattan-Guiness (with JR Ravetz), Joseph Fourier, 1768–1830 (Cambridge, MA: MIT Press, 1972);约翰·赫里维尔,约瑟夫傅立叶:人与物理学家(牛津:牛津大学出版社,1975 年)。
4 . William Wordsworth, The Prelude, or Growth of a Poet's Mind (text of 1805),由 Ernest de Selincourt 和 Stephen Gill 编辑,X:692 (Oxford: Oxford University Press, 1970)。
5 . 约瑟夫·傅立叶,1795 年 6 月/7 月给维莱塔的信,约翰·赫里维尔,约瑟夫·傅立叶:人与物理学家(牛津:牛津大学出版社,1975 年),280。
6 . 约瑟夫·傅立叶,1795 年 6 月/7 月给维莱塔的信,在赫里维尔,约瑟夫·傅立叶,284。
7 . 华兹华斯,前奏曲,X:335。
8 . Robert B. Asprey,拿破仑·波拿巴的崛起(纽约:基础书籍,2000 年);Robert B. Asprey,拿破仑·波拿巴的统治(纽约:基础书籍,2001 年)。Asprey 使用出生名拼写“Nabolione”而不是更常见的“Napoleone”。
9 . 安德鲁·罗宾逊,破解埃及密码:让-弗朗索瓦·商博良的革命生活(牛津:牛津大学出版社,1975 年)。
10 . 格拉坦-吉尼斯,约瑟夫·傅立叶。
11 . Oeuvres de Fourier,由 M. Gaston Darboux 编辑,2 卷,2:97–125(巴黎:Gauthier-Villars et Fils,1888–1890);史蒂夫·琼斯(Steve Jones),《革命性科学:断头台时代的转型与动荡》(纽约:Pegasus Books,2017 年),338。
12 . Grattan-Guiness,约瑟夫·傅立叶,188-193。
13 . Herivel, Joseph Fourier , 189, 引用 JJ Champollion-Figeac, Fourier et Napoleon, l'Egypte et les cent jours (Paris, 1844), 187。
14 . 赫里维尔,约瑟夫·傅立叶,135-136。
15 . Louis L. Bucciarelli 和 Nancy Dworsky,Sophie Germain:弹性理论史论文集(波士顿:D. Reidel,1980 年),第 7-8 章。
16 . 埃菲尔铁塔:埃菲尔铁塔实验室,“72 位学者”,https: //www.toureiffel.paris/en/the-monument/eiffel-tower-and-science,2020 年2 月 18 日访问。
17 . Bucciarelli 和 Dworsky,Sophie Germain,137。
18 . Grattan-Guiness,约瑟夫傅立叶,ix。
19 . González-Velasco,傅里叶分析,23-25、36-44;Grattan-Guiness,约瑟夫·傅立叶,188-193。
20 . Bracewell,傅里叶变换,1-5;Grattan-Guiness,约瑟夫·傅立叶,193。
1 . Aleksandr I. Solzhenitsyn, The Gulag Archipelago: 1918–1956: An Experiment in Literary Investigation (New York: HarperCollins, 2001), 1:590。
2 . Vladimir Aleksandrovich Kotelnikov,“O Propusknoi Sposobnosti 'Efira' i Provoloki v Elektrosvyazi [关于电气通信中'以太'和电线的传输能力]”,载于Vsesoyuznyi Energeticheskii Komitet。Materialy k I Vsesoyuznomu S'ezdu po Voprosam Tekhnicheskoi Rekonstruktsii Dela Svyazi i Razvitiya Slabotochnoi Promyshlennosti。Po Radiosektsii [全联盟能源委员会。第一次全联盟通信设施技术改造和小电流行业进展大会材料。在无线电科](莫斯科:Upravlenie Svyazi RKKA,1933 年),4。
3 . David R. Brillinger,“John W. Tukey:他的生活和专业贡献” ,统计年鉴30(2002):1569–1570;Jon Gertner,理念工厂:贝尔实验室和美国创新的伟大时代(纽约:企鹅出版社,2012 年),135;Fred R. Shapiro,“软件术语的起源:来自 JSTOR 电子期刊档案的证据”,IEEE 计算历史年鉴22(2000):69–71;John Wilder Tukey,“具体数学的教学”,美国数学月刊65(1958 年 1 月):1-9。
4 . WR Bennett,“时分复用系统”,贝尔系统技术期刊20 (1941): 199–221;Denis Gabor,“通信理论” ,电气工程学院学报(伦敦)93(1946):429–457;Karl Küpfmüller,“Wellenfiltern 中的 Über Einschwingvorgänge [滤波器中的瞬态现象]”,Elektrische Nachrichten-Technik 1 (1924):141–152;Harry Nyquist,“电报传输理论中的某些主题”,AIEE 交易(AIEE冬季会议记录,1928 年 2 月 13-17 日,纽约,纽约),617-644;Herbert Raabe,“Untersuchungen an der Wechsilzeitigen Mehrfachübertragung (Multiplexübertragung)”,Elektrische Nachrichtentechnik16 (1939): 213–228; Claude E. Shannon,“A Mathematical Theory of Communication”,贝尔系统技术期刊27(1948 年 7 月,10 月):379-423、623-656;Stephen Mack Stigler,“Stigler 的同名法则”,《纽约科学院学报》 39(1980):147–158;爱德华·泰勒·惠特克(Edward Taylor Whittaker),“关于插值理论扩展所代表的功能”,载于爱丁堡皇家学会会刊35(1915):181-194;John MacNaughton Whittaker,插值函数理论(剑桥:剑桥大学出版社,1935 年)。
5 . Christopher C. Bissell,“Vladimir Aleksandrovich Kotelnikov:采样定理、密码学、最优检测、行星映射的先驱。. . ,” IEEE 通信杂志47 (2009): 32; Mikhail K. Tchobanou 和 Nikolay N. Udalov,“Vladimir Kotelnikov 和莫斯科电力工程学院——采样定理,雷达系统。. . a Fascinating and Extraordinary Life” ,2006 年国际 TICSP 频谱方法和多速率信号处理研讨会论文集,意大利佛罗伦萨,2006 年 9 月 2-3 日,第 177 页。
6 . John Herivel, Joseph Fourier: The Man and the Physicist (Oxford: Oxford University Press, 1975), 154, 172; Natalia Vladimirovna Kotelnikova, “Vladimir Aleksandrovich Kotel'nikov: The Life's Journey of a Scientist,” in Yu V. Gulyaev et al., “Scientific Session of the Division of Physical俄罗斯科学院科学纪念 Vladimir Aleksandrovich Kotelnikov 院士”,Physics-Uspekhi [英文版] 49 (2006): 727。
7 . 科特尔尼科娃,“弗拉基米尔·亚历山德罗维奇·科特尔尼科夫”,728-729。
8 . 科特尔尼科娃,“弗拉基米尔·亚历山德罗维奇·科特尔尼科夫”,728-729。
9 . 米哈伊尔·布尔加科夫,白卫兵(纽黑文:耶鲁大学出版社,2008 年);科特尔尼科娃,“弗拉基米尔·亚历山德罗维奇·科特尔尼科夫”,728-729。
10 . 比塞尔,“弗拉基米尔·亚历山德罗维奇·科捷尔尼科夫”,24;科捷尔尼科娃,“弗拉基米尔·亚历山德罗维奇·科捷尔尼科夫”,729;Tchobanou 和 Udalov,“Vladimir Kotelnikov”,172。
11 . 科捷尔尼科娃,“弗拉基米尔·亚历山德罗维奇·科捷尔尼科夫”,730;Tchobanou 和 Udalov,“Vladimir Kotelnikov”,172-173。
12 . 科捷尔尼科娃,“弗拉基米尔·亚历山德罗维奇·科捷尔尼科夫”,731;Tchobanou 和 Udalov,“Vladimir Kotelnikov”,173。
13 . Richard F. Lyon,“A Brief History of 'Pixel'”,受邀论文发表在 IS&T/SPIE 电子成像研讨会上,2006 年 1 月 15 日至 19 日,加利福尼亚州圣何塞。
14 . 香农,“沟通的数学理论”;Claude E. Shannon,“存在噪音时的通信” ,IRE 37 会议记录,第 3 期。1(1949 年 1 月):10-21。
15 . Fredrich L. Bauer,解密的秘密:密码学的方法和准则(柏林:Springer-Verlag,1997),6;大卫斯塔福德、罗斯福和丘吉尔:秘密人物(纽约:Overlook Press,1999 年),22。
16 . 香农,“噪音中的交流”。
17 . 比塞尔,“弗拉基米尔·亚历山德罗维奇·科捷尔尼科夫”;科捷尔尼科娃,“弗拉基米尔·亚历山德罗维奇·科捷尔尼科夫”。
18 . 索尔仁尼琴,古拉格群岛,1:408。
19 . 罗伯特·康奎斯特,《大恐怖:重新评估》(纽约:牛津大学出版社,2008 年),13-14。
20 . 科特尔尼科娃,“弗拉基米尔·亚历山德罗维奇·科特尔尼科夫”,731-732;约翰·G·赖特,“斯大林的战前清洗”,第四国际,第 2 期。10(1941):311-313。
21 . 科捷尔尼科娃,“弗拉基米尔·亚历山德罗维奇·科捷尔尼科夫”,730。
22 . “GM Krzhizhansovsky 之死” ,苏联出版社当前文摘11 (1959): 31;Mary Hamilton-Dann, Vladimir and Nadya: The Lenin Story (New York: International Publishers, 1998), 16, 19, 22–25, 30–32, 36–38, 40, 47, 53, 65–66, 94, 295; Vladimir Petrovich Kartsev, Krzhizhanovsky (Mir, 1985), 61–62, 171; Frederik Nebeker,电子时代的黎明:塑造现代世界的电气技术,1914 年至 1945 年(新泽西州霍博肯:John Wiley & Sons,2009 年),84;Helena M. Nicolaysen,向后看:俄罗斯社会民主精英的 Prosopography,1883-1907(帕洛阿尔托:斯坦福大学出版社,1990),34、62、65、206、339;斯蒂芬·托马斯Possony, Lenin: The Compulsive Revolutionary (芝加哥: Henry Regnery Company, 1964), 38; Rochelle Goldberg Ruthchild,平等与革命:俄罗斯帝国的妇女权利,1905-1917 年(匹兹堡:匹兹堡大学出版社,2010 年),183;约翰·G·赖特,“斯大林如何为希特勒扫清道路”,第四国际2,第 3 期。9(1941):270-272。
23 . Boris Evseevich Chertok,Rakety I lyudi:Fili Podlipki Tyuratam [火箭和人,卷。2:创造火箭工业],4 卷。(莫斯科:Mashinostroyeniye,1996),2:96-108。
24 . Aleksandr I. Solzhenitsyn, In the First Circle , 修复后的文本,由 Harry T. Willetts 翻译自俄文(纽约:HarperCollins,2009 年),92。
25 . 比塞尔,“弗拉基米尔·亚历山德罗维奇·科捷尔尼科夫”,29;科捷尔尼科娃,“弗拉基米尔·亚历山德罗维奇·科捷尔尼科夫”,731;Tchobanou 和 Udalov,“Vladimir Kotelnikov”,173。
26 . “Amtorg 贸易公司案”,《Recollections of Work on Russian 》 ,文档 3421019,http: //www.gwu.edu/~nsarchiv/NSAEBB/NSAEBB278/06.PDF,2020年 2 月 28 日,1-2 日访问;亚瑟菲尔丁:英仙座传奇,博客,2010 年 9 月 5 日,http: //arthurfielding.blogspot.com/,2020 年 2 月 28 日访问;Vladimir Chikov 和 Gary Kern,评论 Staline a vole la Bomb Atomique Aux Americains:克格勃档案 13676 [斯大林如何从美国人那里偷走原子弹](巴黎:R. Laffont,1996 年);Herbert Romerstein 和 Eric Breindel,维诺纳的秘密:揭露苏联间谍活动和美国的叛徒(华盛顿特区:Regnery,2000 年),206;Henry L. Zelchenko,“窃取美国的技术诀窍:Amtorg 的故事”,《美国水星》 ,1952 年 2 月,75-84。
27 . David Kahn,密码破译者:从古代到互联网的秘密通信综合史(纽约:斯克里布纳,1967 年,1996 年修订和更新);SN Molotkov,“Quantum Cryptography and VA Kotel'nikov's One-Time Key and Sampling Theorems”,Gulyaev 等人,“物理科学部科学会议”[英文版],750-761;Claude E. Shannon,“保密系统的通信理论”,贝尔系统技术杂志28(1949):656-715,n。1个;Tchobanou 和 Udalov,“Vladimir Kotelnikov”,173-174。
28 . 科捷尔尼科娃,“弗拉基米尔·亚历山德罗维奇·科捷尔尼科夫”,732;Tchobanou 和 Udalov,“Vladimir Kotelnikov”,174。
29 . 科捷尔尼科娃,“弗拉基米尔·亚历山德罗维奇·科捷尔尼科夫”,732;Tchobanou 和 Udalov,“Vladimir Kotelnikov”,173-174。
30 . 科捷尔尼科娃,“弗拉基米尔·亚历山德罗维奇·科捷尔尼科夫”,第 732、734 页。
31 . Simon Ings,斯大林和科学家:1905-1953 年的胜利与悲剧史(纽约:大西洋月刊,2016 年),312-314。
32 . Keith Dexter 和 Ivan Rodionov,苏联国防工业的工厂、研究和设计机构:指南,第 13 版,华威大学经济系,2012 年 1 月;科特尔尼科娃,“弗拉基米尔·亚历山德罗维奇·科特尔尼科夫”,733-734;索尔仁尼琴,在第一圈;Marshall Winokur,“从古到今的俄罗斯建筑评论,卷。1:教堂和修道院。日本:俄罗斯东正教青年委员会,1973 年,“斯拉夫和东欧杂志26 (1982): 113。
33 . 索尔仁尼琴,在第一圈,217-218。
34 . Homer W. Dudley,“声码器”,贝尔系统技术期刊17 (1939):122–126;科捷尔尼科娃,“弗拉基米尔·亚历山德罗维奇·科捷尔尼科夫”,731;Dave Tompkins,如何破坏漂亮的海滩:从二战到嘻哈的声码器:机器说话(布鲁克林:梅尔维尔出版社,2011 年),70,122–130。
35 . 索尔仁尼琴,在第一圈,92。
36 . 科捷尔尼科娃,“弗拉基米尔·亚历山德罗维奇·科捷尔尼科夫”,734。
37 . Chertok,Rakety I lyudi,2:106-108;Boris Evseevich Chertok,“VA Kotel'nikov 及其在我国空间无线电电子发展中的作用”,Gulyaev 等人,“物理科学部科学会议”[英文版],761-762;德克斯特和罗季奥诺夫,苏联国防工业的工厂、研究和设计机构。
38 . 科特尔尼科娃,“弗拉基米尔·亚历山德罗维奇·科特尔尼科夫”,734-735。
39 . 医学数字成像和通信 (DICOM),第 14 部分:灰度标准显示功能(Rosslyn,VA:国家电气制造商协会,2004 年)。
40 . E. Brad Meyer 和 David R. Moran,“插入到高分辨率音频播放中的 CD 标准 A/D/A 循环的可听性” ,音频工程学会杂志55(2007):778;Joshua D. Reiss,“高分辨率音频感知评估的元分析” ,音频工程学会杂志,第64 期,不。6(2016 年 6 月):364–379;超级音频 CD 参考,“Thread Debunking Meyer and Moran”,http://www.sa-cd.net/showthread/42987,2020年 2 月 28 日访问。
41 . Vladimir Aleksandrovich Kotelnikov,“无线电时代”,在二十一世纪的生活中,由 Mikhail Vassiliev 和 Sergei Gouschev 编辑,由 HE Crowcroft 和 RJ Wason 翻译(伦敦:企鹅出版社,1961 年),129。
42 . Paul Dickson, Sputnik: The Shock of the Century (New York: Walker Publishing, 2001), 98–99, 130; NASA 的国家空间科学数据中心(Sputnik),https ://nssdc.gsfc.nasa.gov/nmc/spacecraft/display.action?id= 1957-001B,2020 年 2 月 28 日访问。
43 . Ben Evans,《太空中的家:七十年代末到八十年代》(纽约:Springer-Praxis,2012),37;Edward Clinton Ezell 和 Linda Newman Ezell,合作伙伴关系:NASA 阿波罗-联盟号测试项目的历史(纽约州米尼奥拉:多佛,2010 年),182-188。
44 . Lutz D. Schmadel,小行星名称词典,第 5 版,第一卷。1 (柏林: Springer-Verlag, 2003), 231; Tchobanou 和 Udalov,“Vladimir Kotelnikov”,176-177。
45 . Andrei Sakharov 的克格勃档案,由 Joshua Rubenstein 和 Alesander Gribanov 编辑(纽黑文:耶鲁大学,2005 年),193–196。
46 . Vitaly Lazarevich Ginzburg,“The Sakharov Phenomenon”,载于Andrei Sakharov:生活的方方面面(Gif-sur-Yvette,法国:Editions Frontières 和 PN Lebedev 物理研究所,1991 年)。
47 . Chertok,Rakety I lyudi,2:108;时代杂志,1957 年 7 月 22 日,“俄罗斯:快活与死者”。
48 . 比塞尔,“弗拉基米尔·亚历山德罗维奇·科捷尔尼科夫”,32。
49 . 比塞尔,“弗拉基米尔·亚历山德罗维奇·科捷尔尼科夫”;Mark Bykhovskiy,“充满认知和行动的生活(献给 VA Kotelnikov 院士诞辰 100 周年)”,IEEE 信息理论学会通讯59(2009):13-15;Kotelnikov,“O Propusknoi Sposobnosti 'Efira' i Provoloki v Elektrosvyazi”,引言;乔巴努和乌达洛夫,“弗拉基米尔·科捷尔尼科夫”。
50 . Chertok,“VA Kotel'nikov”,765;英格斯、斯大林和科学家,173;Heinrich Lantsberg,“俄罗斯总统普京授予的 IEEE 终身研究员”,IEEE Region 8 News 7 (2004):1;伊桑·波洛克,“斯大林作为科学的核心:战后年代的意识形态和知识”,载于《斯大林:新历史》,莎拉·戴维斯和詹姆斯·哈里斯编辑(剑桥:剑桥大学出版社,2005 年),第 271-288 页;Tchobanou 和 Udalov,“Vladimir Kotelnikov”,177。
1 . Tom Stoppard,Arcadia(伦敦:Faber 和 Faber,1993 年),51-52(摘自第 1 幕,第 4 场)。
2 . 艾伦·图灵讣告,皇家学会研究员传记回忆录,1955 年 11 月 1 日,https: //doi.org/10.1098/rsbm.1955.0019,2020 年2 月 29 日访问;Sara Turing、Alan M. Turing(剑桥:剑桥大学出版社,1959 年;代表百年纪念版,2012 年)。
3 . Harry Hinsley 爵士,“二战中 Ultra 的影响”,http://www.cix.co.uk/~klockstone/hinsley.htm,2020年 2 月 28 日访问;安德鲁·霍奇斯,艾伦·图灵:谜(纽约:西蒙和舒斯特,1983 年)。
4 . B. Jack Copeland,图灵:信息时代的先驱(牛津:克拉伦登出版社,2012 年),285,n。6;霍奇斯,艾伦·图灵,149;萨拉·图灵,艾伦·M·图灵,117。
5 . 谷轮,图灵:先锋,223-234;霍奇斯,艾伦·图灵,487–492;John Dermot Turing 爵士,教授:Alan Turing Decoded(格洛斯特郡切尔滕纳姆:历史出版社,2015 年);萨拉图灵,艾伦 M. 图灵,114-121。
6 . 霍奇斯,艾伦·图灵,71、73 岁。
7 . 谷轮,图灵:先锋,223-234。
8 . David Leavitt,《知道太多的人:艾伦·图灵和计算机的发明》(纽约:Atlas Books,WW Norton,2006 年),18。
9 . Seymour Papert, Mindstorms: Children, Computers, and Powerful Ideas (New York: Basic Books Inc., 1980), viii.
10 . Re Scrooge 会见 Baggins 参见Walt Disney 的 Uncle Scrooge(纽约:戴尔出版公司,1954 年 3 月至 5 月),第 1 期。5、11;JRR Tolkien,《指环王》(波士顿:Houghton Mifflin Harcourt,2004 年),第 1 册,第 1 章,第 1 段。
11 . 托马斯·乌斯克,《爱的遗嘱》 [ca. 1375],由 Gary W. Shawver 编辑(多伦多:多伦多大学出版社,2002 年),II.7.71-73。
12 . 杰弗里·乔叟,《星盘论》;致他的母猪,1391,由 Walter W. Skeat 编辑(伦敦:乔叟协会,1872 年,1880 年出版),I.9.3。
13 . 大卫希尔伯特和威廉阿克曼,数学逻辑原理(纽约:切尔西出版社,1950 年),112-124。
14 . 大卫·安德森,“历史反思:马克斯·纽曼:英国早期计算中被遗忘的人” ,ACM 56 通讯,第 3 期。5(2013 年 5 月):30。
15 . 谷轮,图灵:先锋,1-2;Brian Randell,2014 年 8 月 8 日的电子邮件;萨拉·图灵,艾伦·M·图灵,63 岁。
16 . Michael A. Arbib, Theories of Abstract Automata (Englewood Cliffs, NJ: Prentice-Hall, 1969),第 5-6 章;Stephen Cole Kleene,“自然数的一般递归函数”,数学年鉴 112(1936):727–742;Emil Leon Post,“有限组合过程——公式 I” ,符号逻辑杂志1(1936):103–105;Alan Mathison Turing,“On Computable Numbers, with an Application to the Entsheidungsproblem ” ,伦敦数学会学报,系列 2 42(1936):230–265;Alan Mathison Turing,“可计算性和λ -可定义性” ,符号逻辑杂志2,第 2 期。1 (1937), 153–163。
17 . John S. Farmer 和 WE Henley 编辑,俚语及其类似物:过去和现在,多卷。仅为订阅者打印,1903, 6:368。
18 . Donald Watts Davies,“对图灵通用计算机的修正”,在基本图灵:催生计算机时代的想法,编辑。B. Jack Copeland(牛津:克拉伦登出版社,2004 年),103–124;Martin Davis ed., The Undecidable: Basic Papers on Undecidable Propositions, Unsolvable Problems and Computable Functions (Mineola, NY: Dover, 2004), 115, 118; 霍奇斯,艾伦·图灵,392;Emil Leon Post,“Thue 问题的递归不可解性” ,符号逻辑杂志12(1947):7。
19 . 莱维特,知道太多的人,186-187、196。
20 . George Dyson,图灵大教堂:数字宇宙的起源(纽约:万神殿图书,2012 年),52-53、88-89。
21 . 戴维斯,不可判定,135-140;萨拉·图灵,艾伦·M·图灵,70 岁。
22 . 马丁戴维斯,“什么是计算?” 今日数学:十二篇非正式论文,编辑。Lynn Arthur Steen(纽约:Springer-Verlag,1978 年),246。
23 . Yurii Rogozhin,“小型通用图灵机”,理论计算机科学168(1996):231-233。
24 . Robert A. Heinlein,《月亮是严厉的情妇》(纽约:Orb Books,1997 年)。
25 . 戴森,图灵大教堂,54;Marina von Neumann Whitman,火星人的女儿:回忆录(安娜堡:密歇根大学出版社,2013 年),1-2、7、16-17、50、52、54、60。
26 . Jacob Bronowski,《人类的崛起》 (伦敦:BBC Books,2011),323–327;戴森,图灵大教堂,45,326;Herman H. Goldstine,计算机:从 Pascal 到 von Neumann(新泽西州普林斯顿:普林斯顿大学出版社,1972 年,1980 年平装本,1983 年第五次印刷),167、171。
27 . Jeremy Bernstein,“John von Neumann 和 Klaus Fuchs,一种不太可能的合作”,《透视物理学》第 12 期,第 1 期。1(2010 年 3 月):36–50。
28 . 霍奇斯,艾伦·图灵,95、117-132、144-145。
29 . B. Jack Copeland 编辑,巨像:布莱切利公园密码破解计算机的秘密(牛津:牛津大学出版社,2006 年),157–158。
30 . 谷轮,巨像,380–381。
31 . Homer W. Dudley,“声码器研究三十年” ,美国声学学会杂志36(1964):1021;Dave Tompkins,如何破坏美丽的海滩:从二战到嘻哈的声码器:机器说话(布鲁克林:梅尔维尔出版社,2011 年),48、81,第 2-3 章。
32 . 大卫安德森,“曼彻斯特婴儿是在布莱切利公园怀上的吗?” 英国计算机协会,2007 年 11 月,2004 年草稿,https ://www.researchgate.net/publication/228667497_Was_the_Manchester_Baby_conceived_at_Bletchley_Park.pdf,2020 年 5 月 15 日访问;霍奇斯,艾伦·图灵,245–246;汤普金斯,如何破坏美丽的海滩, 42。
33 . 谷轮,图灵:先锋,241,n。14; Martin Davis, Computability & Unsolvability (New York: McGraw-Hill, 1958), 70; Martin Davis,通用计算机:从莱布尼茨到图灵的道路(纽约:WW Norton,2000),159–160。
34 . Simon Lavington, ed., Alan Turing and His Contemporaries: Building the World's First Computers (London: British Informatics Society, 2012), 82.
35 . Donald E. Knuth,计算机编程艺术,卷。1:基本算法(加利福尼亚州门洛帕克:Addison-Wesley,1968 年),前言。
36 . 戴森,图灵大教堂。
37 . 谷轮,基本图灵,383;George Dyson,私人通讯,2013 年 3 月,摘自新泽西州普林斯顿高等研究院谢尔比怀特和莱昂利维档案中心的约翰冯诺依曼档案,主计长办公室的三封注明日期的信件。
38 . George Dyson,私人通讯,2013 年 3 月。
39 . George Dyson,私人通讯,2013 年 3 月。
40 . Copeland,《基本图灵》,388、390、391;David Alan Grier,“ENIAC,动词‘编程’和数字计算机的出现”,IEEE 计算历史年鉴18,第 1 期。1 (1996): 51-53; John Mauchly,“The Use of High Speed Vacuum Tube Devices for Calculating”,1942 年 8 月,由 Brian Randell 编辑,数字计算机的起源:论文选集(纽约:Springer-Verlag,1973 年),330–331。
41 . 查尔斯·斯科特·谢灵顿,《人的本性》(剑桥:剑桥大学出版社,1942 年),178。
42 . Turlough Neary 和 Damien Woods,“四个小型通用图灵机”,Fundamenta Informaticae 91 (2009):120–123;Claude E. Shannon,“具有两个的通用图灵机内部状态”,Claude E. Shannon 和 John McCarthy 编辑,Automata Studies(新泽西州普林斯顿:普林斯顿大学出版社,1956 年),157–165。
43 . 戴森,图灵大教堂,225–242。
44 . 霍奇斯,艾伦·图灵,78 岁。
45 . Virginia Woolf, Virginia Woolf: The Complete Collection,包括日记(5 卷,1977–1984),Amazon.com Kindle 版,AtoZ Classics,2018。
46 . 威廉·纽曼(William Newman),“嫁给一位数学家:林恩·纽曼(Lyn Newman)的文学生活”,The Eagle(剑桥圣约翰学院,2002 年),47-56,http://www.mdnpress.com/wmn/pdfs/MarriedToaMathematician.pdf ,于 2020 年 2 月 29 日访问,1-3。
47 . Sara Turing,艾伦 M. 图灵,xxi。
1 . Manchester Baby,https://www.youtube.com/watch?v= cozcXiSSkwE,2020 年 2 月 22 日访问。
2 . 曼彻斯特宝贝。
3 . B. Jack Copeland 编辑,巨像:布莱切利公园密码破解计算机的秘密(牛津:牛津大学出版社,2006 年),301;B. Jack Copeland,图灵:信息时代的先驱(牛津:克拉伦登出版社,2012 年),104、107。
4 . Copeland, Turing: Pioneer , 64, 113–116.
5 . B. Jack Copeland,“曼彻斯特计算机:修订历史。第 1 部分:内存”,IEEE 计算历史年鉴33(2011):4-21;Tom Kilburn,“从阴极射线管到 Ferranti Mark I”,复活:计算机保护协会公报1,第 1 期。2 (1990): 16-20; Frederic Calland Williams (1911–1977),http: //curation.cs.manchester.ac.uk/computer50/www.computer50.org/mark1/williams.html,2020年 2 月 29 日访问;Frederic C. Williams 和 Tom Kilburn,“A Storage System for Use with Binary-Digital Computing Machines” ,IEE 96 会议记录,第三部分,第 40(1949 年 3 月):100。
6 . Copeland,“曼彻斯特计算机:第 1 部分”。
7 . Tom Kilburn,“A Storage System for Use with Binary Digital Computing Machines”,1947 年 12 月 1 日,给英国大莫尔文电信研究机构的报告,第 2 节;Williams 和 Kilburn,“存储系统”,82。
8 . Dai Edwards,2013 年 7 月 16 日的电子邮件;Kilburn,A Storage System,第 1.4、1.5、4.2、6 节;Thomas Lean,采访者,“David Beverley George (Dai) Edwards Interview”,An Oral History of British Science,参考编号。C1379/11(伦敦:大英图书馆委员会,2010 年),68-69;Frederic C. Williams,“曼彻斯特大学的早期计算机” ,无线电和电子工程师45(1975):327–328;Williams 和 Kilburn,“存储系统”。
9 . Chris Burton,2013 年 6 月 24 日的电子邮件;Dai Edwards,2013 年 7 月 16 日的电子邮件;精益,“戴·爱德华兹访谈”,87。
10 . Chris Burton,2013 年 9 月 13 日,6 月 24 日的电子邮件。
11 . TS Eliot,诗歌:1909-1925(纽约:Harcourt,Brace,1925)。
12 . B. Jack Copeland, ed., The Essential Turing: The Ideas That Give to the Computer Age (Oxford: Clarendon Press, 2004), 378–379, 383; B. Jack Copeland 编辑,艾伦·图灵的电子大脑:打造世界上最快的计算机 ACE 的斗争(牛津:克拉伦登出版社,2005 年;平装本,2012 年),455–456;George Dyson,图灵大教堂:数字宇宙的起源(纽约:万神殿图书,2012 年),第 136 页;Brian Randell,“论艾伦·图灵和数字计算机的起源”,机器智能7(1972):3-20;Dai Edwards:第一台存储程序计算机,https://www.youtube.com/watch?v= T8JEexHSh1U,2020 年 2 月 22 日访问。
13 . BE Carpenter,“图灵和 ACE:1946 年计算机设计的教训”。第 15 届 CERN 计算学院。8 月 30 日至 9 月,意大利拉奎拉 12, 1992, 230–234(日内瓦:欧洲核子研究中心,1993),231。
14 . Copeland,艾伦·图灵的电子大脑,第 20 章,369;安德鲁·霍奇斯,艾伦·图灵:谜(纽约:西蒙和舒斯特,1983 年),305–307;Simon Lavington,2013 年 9 月的电子邮件;AlanTuring.net:计算历史的图灵档案,http://www.alanturing.net/index.htm,2020年 2 月 29 日访问。
15 . Copeland,艾伦·图灵的电子大脑,114;霍奇斯,艾伦·图灵,“水星延迟”一章;Simon Lavington, ed., Alan Turing and His Contemporaries: Building the World's First Computers (London: British Informatics Society, 2012), 13, 80.
16 . 谷轮,基本图灵,368–369, 388。
17 . Frederic C. Williams 和 Tom Kilburn,“电子数字计算机”,《自然》 162(1948):487;B. Jack Copeland,“曼彻斯特计算机:修订历史。第 2 部分:婴儿计算机,” IEEE 计算历史年鉴33(2011):22-37。
18 . Chris Burton,2013 年 9 月 9 日的电子邮件;Simon Lavington, A History of Manchester Computers (Swindon, Wiltshire: The British Computer Society, 1998), 17。
19 . 大卫安德森,“曼彻斯特婴儿是在布莱切利公园怀上的吗?” 英国计算机协会,2007 年 11 月,2004 年草稿,https ://www.researchgate.net/publication/228667497_Was_the_Manchester_Baby_conceived_at_Bletchley_Park.pdf,2020 年 5 月 15 日访问,39;Tom Kilburn,“曼彻斯特大学通用高速数字计算机”,Nature 164 (1949): 684;Lean,“戴·爱德华兹访谈”,第 58、60 页;威廉姆斯,“曼彻斯特的早期计算机”,328。
20 . Chris Burton,2013 年 9 月的电子邮件;Copeland,艾伦·图灵的电子大脑,第 20 章;Kilburn,一个存储系统,参考书目;拉文顿,艾伦·图灵和他的同时代人,96;Brian Randell,2014 年 8 月 8 日的电子邮件;Williams 和 Tom Kilburn,“电子数字计算机”。
21 . 拉文顿,曼彻斯特计算机的历史, 17-18。
22 . 卫报,曼彻斯特,1951 年 7 月 9 日;拉文顿、艾伦·图灵和他的同时代人,38 岁;Alan M. Turing (1912–1954),http ://curation.cs.manchester.ac.uk/computer50/www.computer50.org/mark1/turing.html,2020年 2 月 29 日访问。
23 . 谷轮,图灵:先驱,132。
24 . 霍奇斯,艾伦·图灵,352–353;Lavington, Alan Turing and His Contemporaries , 25, 81–82; Alan Macfarlane,电影采访领先思想家,收藏,流媒体服务,剑桥大学,采访大卫哈特利,2017 年 5 月 2 日。
25 . Edsac 99,剑桥大学计算机实验室 Edsac 50 周年纪念网站,https ://www.cl.cam.ac.uk/events/EDSAC99/,2020 年2 月 29 日访问;拉文顿、艾伦·图灵和他的同时代人,28 岁。
26 . 精益,“戴·爱德华兹访谈”,90;旋风双周报,1947 年 12 月 15 日至 12 月。1951 年 21 月,麻省理工学院伺服机构实验室,马萨诸塞州剑桥市;Maurice V. Wilkes、David J. Wheeler 和 Stanley Gill,电子数字计算机程序的准备:特别参考 EDSAC 和子程序库的使用(马萨诸塞州剑桥市:Addison-Wesley,1951 年)。
27 . Copeland,艾伦·图灵的电子大脑,115。
28 . George Dyson,2013 年 4 月 22 日的电子邮件;Marina von Neumann Whitman,火星人的女儿:回忆录(安娜堡:密歇根大学出版社,2013 年),50。
29 . Herman H. Goldstine,计算机:从 Pascal 到 von Neumann(新泽西州普林斯顿:普林斯顿大学出版社,1972 年,1980 年平装本,1983 年第五次印刷),233;Hans Neukom,“ENIAC 的第二人生”,IEEE 计算历史年鉴28,第 3 期。3(2006 年 4 月至 6 月):4-16。
30 . Bertram Vivian Bowden, ed., Faster than Thought: A Symposium on Digital Computing Machines (London: Sir Isaac Pitman & Sons, 1953), 174; Thomas Haigh、Mark Priestley 和 Crispin Rope,“设计‘ENIAC 的奇迹’:实现现代代码范式”,IEEE 计算历史年鉴36,第 3 期。2 (2014): 41–59; Thomas Haigh、Mark Priestley 和 Crispin Rope,ENIAC 在行动:制造和改造现代计算机(马萨诸塞州剑桥市:麻省理工学院出版社,2016 年)。
31 . George Dyson,2017 年 8 月 16 日和 10 月 25 日的电子邮件。
32 . 鲍登,比想象的更快,ix;谷轮,基本图灵;Martin Davis,通用计算机:从莱布尼茨到图灵的道路(纽约:WW Norton,2000),177–183;戴森,图灵大教堂;Goldstine,计算机:从帕斯卡到冯诺依曼,324、349–362;拉文顿,艾伦·图灵和他的同时代人,8-9;旋风双周报告,没有。185,1947 年 12 月 15 日,第 185 页。1361 年,1951 年 12 月 21 日。
33 . Rachael Hanley,“从 Googol 到 Google”,斯坦福日报,2003 年 2 月 12 日, http://web.archive.org/web/20100327141327/http ://www.stanforddaily.com/2003/02/12/from -googol-to-google,2020 年 2 月 29 日访问。
34 . 戴森,图灵大教堂,68-69、103、148。
35 . 拉文顿,《曼彻斯特计算机史》,22。
36 . Chris Burton,2014 年 7 月的电子邮件;计算机 50:曼彻斯特大学庆祝现代计算机的诞生,http ://curation.cs.manchester.ac.uk/computer50/www.computer50.org/index.html,2020 年 2 月 29 日访问。
37 . B. Jack Copeland 和 AA Haeff,“Andrew V. Haeff:电子管时代之谜和被遗忘的计算先驱”,IEEE 计算历史年鉴37,第 3 期。1 (2015): 67–74。
38 . Charles W. Adams,“Whirlwind I 计算机的批处理操作系统” ,全国计算机会议论文集(1987 年):787–788。
39 . John (Jack) T Gilmore Jr.,“回顾 II:麻省理工学院、林肯实验室和哈佛计算机图形学的早期研究”,Siggraph '89 小组会议记录(Siggraph '89,波士顿,1989 年 7 月 31 日至 8 月 4 日),幻灯片 3,第 40; Edward R. Murrow,“Jay W. Forrester 和旋风计算机” ,立即查看,1951 年 12 月 16 日,https ://criticalcommons.org/view?m= DTVj10Hz5,2020 年 3 月 1 日访问;Norman H. Taylor,“回顾 I:麻省理工学院、林肯实验室和哈佛计算机图形学的早期研究”,Siggraph '89 小组会议记录(Siggraph '89,波士顿,1989 年 7 月 31 日至 8 月 4 日),幻灯片 3,p . 20.
40 . 旋风双周报告,没有。899,1949 年 9 月 16 日,1。
41 . 亚当斯,“旋风的批处理操作系统”,787-788;Fred Gruenberger, ed., Computer Graphics: Utility/Production/Art (Washington, DC: Thompson Book Company, 1967), 106.
42 . Doug Huskey [儿子],2013 年 8 月 25 日的电子邮件。
43 . J. Presper Eckert Jr.、H. Lukoff 和 G. Smoliar,“动态再生静电记忆系统” ,IRE 会议记录(1950 年):498-510。
44 . Jack Copeland,2014 年 8 月 3 日的电子邮件;Eckert 等人,“动态再生静电记忆系统”;Herman Lukoff, From Dits to Bits: A Personal History of the Electronic Computer (Portland, OR: Robotics Press, 1979), 88.
45 . Chris Burton,2013 年 9 月 13 日的电子邮件;Krista Ferrante,2016 年 10 月 20 日的电子邮件;1951 年 AIEE-IEE 会议论文集,“电子数字计算机评论”,1951 年 12 月 10-12 日,59,71;旋风双周报告,没有。1326,1951 年 10 月 26 日,19。
46 . Dai Edwards,2013 年 7 月 16 日的电子邮件;曼彻斯特电子计算机(Hollinwood, UK: Ferranti, 1952), 13.
47 . 谷轮,基本图灵,356-357;霍奇斯,艾伦·图灵,446–447、477;David Link,“Programming ENTER:Christopher Strachey 的草稿计划”,复活:计算机保护协会公报60(2012 年冬季):23-24;Christopher Strachey,牛津大学博德利安图书馆,英国牛津,Christopher Strachey 档案,文件夹 CSAC 71.1.80/C.20–C.33 用于他的草稿程序,1950–1952,文件夹 C20–C33。
48 . Martin Campbell-Kelly,2013 年 7 月 28 日的电子邮件;Alexander Shafto Douglas,“Noughts and Crosses: An Early Computer Version”,草稿,1992 年 4 月 9 日,供 Martin Campbell-Kelly 编辑,IEEE Annals of the History of Computing 14,no. 4(1992 年 10 月至 12 月),Edsac 特刊;Joyce M. Wheeler,“Edsac 的应用”,IEEE 计算历史年鉴14,第 1 期。4(1992 年 10 月至 12 月),28。
49 . Martin Campbell-Kelly,“从过去到现在:Edsac 模拟器”,第一台计算机:历史和架构,编辑。Raúl Rojas 和 Ulf Hashagen(马萨诸塞州剑桥:麻省理工学院出版社,2000 年),409;Martin Campbell-Kelly,2013 年 7 月 9 日至 10 日的电子邮件。
50 . Jack Copeland,7 月至 9 月的电子邮件。2014 年。
51 . Martin Campbell-Kelly,2013 年 7 月 9 日的电子邮件。
52 . Taylor,“回顾展 I”,幻灯片 6。
53 . Fred Brooks,个人谈话,2018 年 8 月 13 日;J. Martin Graetz,“太空战争的起源”,Creative Computing 7,第 7 期。8(1981 年 8 月):60。
54 . 亚当斯,“旋风的批处理操作系统”,787-788;Gilmore,“回顾展 II”,幻灯片 3,p。40; Gruenberger,计算机图形学,106;Hrand Saxenian,Whirlwind 1 编程,报告 R-196,1951 年 6 月 11 日,麻省理工学院数字计算机实验室,55;Taylor,“回顾展 I”,幻灯片 7。
55 . David E. Weisberg,工程设计革命:永远改变工程实践的人员、公司和计算机系统。2008,http ://cadhistory.net/,2020 年 3 月 1 日访问,第 3 章,p. 5.
56 . https://criticalcommons.org/Members/ccManager/clips/mits-whirlwind-computer-debuts-on-see-it-now-with/view,2020年 2 月 22 日访问。
57 . Martin Davis,2013 年 10 月 18 日的电子邮件。
58 . A. Robin Forrest,战争与和平与计算机图形学:从冷战到星球大战,Microsoft PowerPoint演示文稿,2013 年 11 月;Robin Forrest,采访,伦敦,2016 年 9 月 5 日;Merwin 传记,https: //www.computer.org/volunteering/awards/merwin/about-merwin,2020年 2 月 29 日访问。
59 . 尼克英格兰,2019 年 8 月 11 日的电子邮件。
60 . 维基百科,Baudot 代码,于 2019 年 8 月 12 日访问。
61 . ASCII 艺术品:RTTY 收藏,http ://artscene.textfiles.com/rtty/,2020年 2 月 22 日访问;John Sheetz,https://www.youtube.com/watch?v= c1Beg5qb4is ,2020 年 2 月 22 日访问。
62 . James Kajiya,2017 年 4 月 29 日的电子邮件;罗伯特舒马克,2018 年 3 月 6 日的电子邮件;Dick Shoup,2014 年 1 月的电子邮件;KW Uncapher,Rand 视频图形系统——通用用户计算机图形通信系统的方法,R-753-ARPA,1971 年 4 月,4,11-12。
63 . Stewart Brand,媒体实验室:在 MIT 创造未来(纽约:维京企鹅,1987 年),171;罗伯特舒马克于 2018 年 3 月 4 日至 5 日发送电子邮件;Richard G. Shoup,“数字生成图片中的一些量化效应” ,信息显示协会国际研讨会,技术论文摘要4(1973):58-59;SuperPaint 系统 (1973–1979),http ://web.archive.org/web/20020110013554/http://www.rgshoup.com:80/prof/SuperPaint/ ,2020 年 2 月 22 日访问;Nicholas Negroponte,“计算机图形学的光栅扫描方法”,计算机与图形学2,第 2 期。3(1977):191-192。
64 . Bob Schumacker,2018 年 3 月 4 日的电子邮件;Shoup,“一些量化效应”。
65 . Malcolm Blanchard,2014 年 1 月 29 日的电子邮件;Edwin Catmull,“曲面计算机显示的细分算法”,博士论文,犹他大学,1974 年 12 月;Franklin C. Crow,“计算机生成的阴影图像中的混叠问题” ,ACM 通信20 (1977):799–805。
1 . 列夫·托尔斯泰的《战争与和平》,路易丝和艾尔默·莫德翻译(纽约:Alfred A. Knopf,1992 年),第一行,第 3 册,第 3 部分,第 1 章。
2 . Laurent Mannoni,光与影的伟大艺术:电影考古学(埃克塞特:埃克塞特大学出版社,2000 年),xix。
3 . Edward Ball,《发明家与大亨》(纽约:Doubleday,2013 年);Henry V. Hopwood,Living Pictures:他们的历史、照片制作和实际工作,附有英国专利摘要和带注释的参考书目(伦敦:眼镜商和摄影行业评论,1899 年),238。
4 . 鲍尔,《发明家与大亨》,30 岁;Gordon Hendricks,Eadweard Muybridge:电影之父(纽约:Grossman Publishers,1975),71;曼诺尼,光与影的伟大艺术,307;丽贝卡·索尔尼特(Rebecca Solnit),阴影之河:Eadweard Muybridge 和技术狂野西部(纽约:企鹅图书,2003 年),139。
5 . 亨德里克斯,埃德沃德·迈布里奇,46 岁;鲍尔,《发明家与大亨》,123–125。
6 . 索尔尼特,阴影之河,185-187。
7 . Marta Braun,Eadweard Muybridge(伦敦:Reaktion Books Ltd.,2010 年),161。
8 . Ball, The Inventor and the Tycoon , 6, 12–18, 120–123, 307–361, 第 21 章;索尔尼特,阴影之河,184-185。
9 . WKL Dickson 和 Antonia Dickson,Kinetograph、Kinetooscope 和 Kineto-Phonograph 的历史(纽约:WKL Dickson,1895 年);Charles Musser,电影的出现:1907 年的美国银幕(伯克利:加州大学出版社,1990 年;平装本,1994 年),45-48;Alvy Ray Smith,Zoetrope 和 Zoopraxiscope 的快门机制,2015 年,http: //alvyray.com/Papers/ShutteringMechanisms.pdf,2020 年3 月 1 日访问,第 1 节;Paul C. Spehr,制作电影的人:WKL Dickson(New Barnet,Herts.:John Libbey,2008),76。
10 . Carlos Rojas 和 Eileen Chow 编辑,《牛津中国电影手册》(牛津:牛津大学出版社,2013 年),5。
11 . Athanasius Kircher,Ars Magna Lucis et Umbrae(修订后的第二版,阿姆斯特丹,1671 年),768;世界上最古老的魔灯,https ://www.luikerwaal.com/newframe_uk.htm? /oudste_uk.htm,2020 年 2 月 24 日访问;Musser,电影的出现,21。
12 . 鲍尔,《发明家与大亨》,367;Smith,Zoetrope 和 Zoopraxiscope 的快门机制,第 2 节。
13 . 鲍尔,发明家和大亨;索尔尼特,阴影之河;JDB Stillman,The Horse in Motion(波士顿:James R. Osgood and Company,1882 年)。
14 . 亨德里克斯,埃德沃德·迈布里奇,141-142。
15 . 鲍尔,《发明家与大亨》,306、333–334。
16 . 鲍尔,《发明家与大亨》,323。
17 . 斯佩尔,《电影制作人》,650。
18 . Gordon Hendricks,爱迪生电影神话(伯克利:加州大学出版社,1961 年),106-108。
19 . 霍普伍德,《活生生的图画》,88-91;Paul Potash,2015 年 10 月 18 日的电子邮件;斯佩尔, 《电影制作人》 , 106、133 。
20 . David DiFrancesco,2017 年 2 月 14 日的电子邮件;Paul Potash,2015 年 10 月 18 日的电子邮件。
21 . Luiz Carlos L. Silveira 和 Harold D. de Mello Jr.,“灵长类视觉的平行路径:M 和 P 细胞在傅立叶空间中的信息采样”,视网膜的发育和组织:从分子到功能,编。LM Chalupa 和 BL Finlay(纽约:Plenum Press,1998),173–199。
22 . Dale Purves、Joseph A. Paydarfar 和 Timothy J. Andrews,“电影和现实中的马车车轮幻觉” ,美国国家科学院院刊93(1996 年 4 月):3693–3697。
23 . 霍普伍德,《活生生的图画》,226;Laurent Mannoni, Georges Demenÿ: Pionnier du Cinéma (Douai: Éditions Pagine, 1997)。
24 . 唐纳德·克拉夫顿,《米奇之前:动画电影,1898-1928》(芝加哥:芝加哥大学出版社,1982 年,1993 年出版);亨德里克斯,爱迪生电影神话;霍普伍德,《活生生的图画》;曼诺尼,伟大的光影艺术;Musser,电影的出现;Paul Potash,2015 年 10 月 18 日的电子邮件;Jacques Rittaud-Hutinet, Letters: Auguste and Louis Lumière: Inventing the Cinema (伦敦: Faber and Faber, 1995);斯佩尔,制作电影的人。
25 . Richard Brown 和 Barry Anthony,The Kinetoscope:A British History(东伯内特,赫兹,英国:John Libbey Publishing,2017 年);霍普伍德,《活生生的图画》,65、98、238、240;Musser,电影的出现,91;斯佩尔,制作电影的人,106-111。
26 . Richard Howells,“Louis Le Prince:证据的主体”,第 47屏,第 2(2006 年 7 月):187、195;E. Kilburn Scott,“Le Prince 在电影摄影方面的先驱作品” ,摄影杂志(皇家摄影学会汇刊) 63(1923 年 8 月):373–378;E. Kilburn Scott,“LAA Le Prince 的职业生涯” ,电影工程师协会杂志17,第 1 期。1(1931 年 7 月):46-66;Spehr,制作电影的人,111-117;David Nicholas Wilkinson,第一部电影(2016 年),https ://vimeo.com/ondemand/thefirstfilm/181293064,2020 年 2 月 24 日访问;Roundhay 花园场景(1888 年),https://www.youtube.com/watch?v= nR2r__ZgO5g,于 2020 年 2 月 24 日访问。
27 . Musser,电影的出现,115-116。
28 . 斯佩尔,《电影制作人》,115。
29 . Walter Isaacson、Steve Jobs(纽约:Simon & Schuster,2011 年),347。
30 . Paul Spehr,2015 年 6 月 15 日的电子邮件。
31 . 亨德里克斯,爱迪生电影神话,附录 B;Musser,电影的出现,63、67。
32 . Paul Spehr,2015 年 6 月 15 日的电子邮件。
33 . 迪克森和迪克森,动画机的历史,4, 54-55。
34 . WKL Dickson 和 Antonia Dickson,Thomas Alva Edison 的生活和发明(纽约:Thomas Y. Crowell & Co.,1894 年),前言。
35 . 斯佩尔,《电影制作人》,9。
36 . 亨德里克斯,爱迪生电影神话,163–168,附录 C。
37 . 迪克森和迪克森,动画机的历史,54。
38 . Alvy Ray Smith、William Kennedy Laurie Dickson:电影先驱的家谱调查,2019 年 11 月 3 日,http: //alvyray.com/DigitalLight/WilliamKLDickson_v2.34.pdf,2020 年 3 月 1 日访问。
39 . Paul Spehr,2015 年 6 月 15 日的电子邮件;WKL Dickson Filmography,https: //www.imdb.com/name/nm0005690/,2020年 2 月 24 日访问。
40 . Gordon Hendricks,电影放映机(纽约:Gordon Hendricks,1966 年),58-59;Paul Spehr,2015 年 6 月 15 日的电子邮件。
41 . Paul Spehr,2015 年 6 月 15 日和 2015 年 8 月 17 日的电子邮件。
42 . Paul Spehr,2015 年 6 月 10 日的电子邮件。
43 . 斯佩尔,《电影制作人》,618。
44 . 霍普伍德,《活生生的图画》,261;Paul Spehr,2015 年 8 月 17 日,6 月 15 日的电子邮件。
45 . 曼诺尼,光与影的伟大艺术,457。
46 . Charles Musser, Thomas A. Edison and His Kinetographic Motion Pictures (New Brunswick, NJ: Rutgers University Press, 1995), 20; Smith, William Kennedy Laurie Dickson,图 12;Paul Spehr,2015 年 9 月 14 日的电子邮件。
47 . 斯佩尔,电影制作人,290–294;Paul Spehr,2015 年 9 月 14 日的电子邮件。
48 . 霍普伍德,《活生生的图画》,36-39;Musser,电影的出现,145;Spehr,电影制作人,352;Paul Spehr,2015 年 8 月 17 日的电子邮件。
49 . 曼诺尼,光与影的伟大艺术,325。
50 . 鲍尔,《发明家与大亨》,318–319、334;曼诺尼,光与影的伟大艺术,331;Musser,电影的出现,66;斯佩尔,制作电影的人,142–147。
51 . 斯佩尔,《电影制作人》,138-140、142-147;Paul Spehr,2015 年 8 月 17 日的电子邮件。
52 . 曼诺尼,光与影的伟大艺术,436。
53 . 曼诺尼,光与影的伟大艺术,422。
54 . Rittaud-Hutinet, Letters: Auguste and Louis Lumière , 16-22, 195-200。
55 . 曼诺尼,光与影的伟大艺术,346-350;Spehr,制作电影的人,111-117;Paul Spehr,2015 年 9 月 5 日的电子邮件。
56 . Musser,电影的出现,135、177。
57 . Thierry Lefebvre、Jacques Malthête 和 Laurent Mannoni 合编,Lettres d'Étienne-Jules Marey à Demenÿ,1880 – 1894 年(巴黎:Association française de recherche sur l'histoire du cinéma,电影图书馆,2000);Mannoni , Georges Demenÿ ; 曼诺尼,光与影的伟大艺术。
58 . Lefebvre,Malthête 和 Mannon,Lettres d'Étienne-Jules Marey à Demenÿ;曼诺尼,光与影的伟大艺术,333-363。
59 . 霍普伍德,《活生生的图画》,83。
60 . 曼诺尼,光与影的伟大艺术,362。
61 . 曼诺尼,光与影的伟大艺术,417-421、442-450。
62 . 曼诺尼,光与影的伟大艺术,446-449。
63 . 曼诺尼,光与影的伟大艺术,434-439。
64 . Mannoni , Georges Demenÿ , 78–83; Laurent Mannoni,2015 年 8 月 18 日的电子邮件;Rittaud-Hutinet,信件:Auguste 和 Louis Lumière,195–200。
65 . 曼诺尼,光与影的伟大艺术,430;Paul Spehr,2015 年 12 月 9 日的电子邮件。
66 . Paul Spehr,2015 年 9 月 5 日的电子邮件。
67 . 维基百科,Motion Picture Patents Co. 诉 Universal Film Manufacturing Co.,于 2020 年 5 月 17 日访问。
68 . 克拉夫顿,在米奇之前,12 岁。
69 . 克拉夫顿,在米奇之前,110。
70 . 克拉夫顿,在米奇之前,110。
71 . 克拉夫顿,在米奇之前,232–235。
72 . 克拉夫顿,在米奇之前,61 岁。
73 . 克拉夫顿,在米奇之前,112-116。
74 . 同上,58-89;Donald Crafton、Émile Cohl、漫画和电影(新泽西州普林斯顿:普林斯顿大学出版社,1990 年);Fantasmagorie,https: //publicdomainreview.org/collection/emile-cohl-s-fantasmagorie-1908 ,于 2020 年 2 月 24 日访问。
75 . 克拉夫顿,在米奇之前,110、113。
77 . 克拉夫顿,在米奇之前,77 岁。
78 . 克拉夫顿,在米奇之前,192-200。
79 . 克拉夫顿,在米奇之前,137-150。
80 . 克拉夫顿,在米奇之前,150–157。
81 . 克拉夫顿,在米奇之前,244–246。
82 . 弗兰克·托马斯和奥利·约翰斯顿,迪斯尼动画:生活的幻觉(纽约:阿布维尔出版社,1981 年),51。
83 . Laurent Mannoni 和 Donata Pesenti Campagnoni,Lanterne Magique et Film Peint: 400 Ans de Cinéma (Paris: Éditions de La Martinière, 2009), 182–183, 249。
84 . 克拉夫顿,在米奇之前,169–173。
86 . Leslie Iwerks 和 John Kenworthy,鼠标背后的手(纽约:迪士尼版,2001),24、236。
87 . Iwerks 和 Kenworthy,《老鼠背后的手》,15。
88 . Neal Gabler,沃尔特·迪斯尼:美国想象力的胜利(纽约:Alfred A. Knopf,2006 年),46-50;Iwerks 和 Kenworthy,老鼠背后的手,1-14。
89 . Edwin G. Lutz,动画卡通:它们是如何制作的,它们的起源和发展(纽约:查尔斯斯克里布纳的儿子,1920 年)。
90 . Iwerks 和 Kenworthy,《老鼠背后的手》,15-24。
91 . 加布勒,华特迪士尼,112–115;Iwerks 和 Kenworthy,老鼠背后的手,53-56;威廉·西尔维斯特,拯救迪士尼:罗伊·E·迪士尼故事(主题公园出版社,2015 年),7。
92 . Iwerks 和 Kenworthy,鼠标背后的手,55-57。
93 . 加布勒,华特迪士尼,143–144;Iwerks 和 Kenworthy,鼠标背后的手,78-84。
94 . Iwerks 和 Kenworthy,《老鼠背后的手》,87。
95 . Iwerks 和 Kenworthy,鼠标背后的手,vi。
96 . David A. Bossert,Remembering Roy E. Disney:传奇生活的回忆和照片(洛杉矶:迪士尼版,2013 年);西尔维斯特,拯救迪士尼;Alvy Ray Smith,“1977 年 1 月 3 日迪士尼朝圣记录”, http: //alvyray.com/Pixar/documents/Disney1977Visit_EdAlvyDick.pdf,2020 年 4 月 4 日访问。
97 . 克拉夫顿,在米奇之前,十五,前言。
98 . 克拉夫顿,在米奇之前,301。
99 . 克拉夫顿,在米奇之前,第 9 章,300–321。
1 . IJ Schoenberg, Cardinal Spline Interpolation (Philadelphia: Society for Industrial and Applied Mathematics (SIAM), 1973), v.
2 . Tom Porter,2016 年 8 月 4 日的电子邮件;https://www.discogs.com/Ustad-Ali-Akbar-Khan-Pandit-Ravi-Shankar-With-Ustad-Alla-Rakha-At-San-Francisco/release/2804789,2020年 2 月 25 日访问。
3 . 亨利大卫梭罗,“春天”,瓦尔登湖,或森林中的生活(波士顿:1864 年),第 232-233 页,共 248 页。
4 . Robin Forrest,2017 年 6 月 12 日的谈话。
5 . Andy Hertzfeld,Creative Think,研讨会,1982 年 7 月 20 日,https: //www.folklore.org/StoryView.py?project=Macintosh&story=Creative_Think.txt ,2020 年 3 月 1 日访问;Alan Kay,2016 年 7 月 3 日的电子邮件;http://billkerr2.blogspot.com/2006/12/point-of-view-is-worth-80-iq-points.html,2020年 2 月 25 日访问。
6 . Edward Taylor Whittaker 和 George Robinson,A Short Course in Interpolation(伦敦:Blackie and Son,1923 年),2。
7 . Robin Forrest,2017 年 6 月 12 日的谈话。
8 . Tom Porter,2017 年 3 月 17 日的电子邮件。
9 . Edwin Catmull,“曲面计算机显示的细分算法”,博士论文,犹他大学,1974 年 12 月,附录 A;Edwin Catmull 和 Raphael Rom,“A Class of Local Interpolating Splines”,计算机辅助几何设计,编辑。RE Barnhill 和 RF Riesenfeld(纽约:学术出版社,1974 年),317–326;James H. Clark,计算机图形学和计算机辅助几何设计中的参数曲线、曲面和体积,技术报告 221,斯坦福大学计算机系统实验室,加利福尼亚州帕洛阿尔托,1981 年 11 月;Alvy Ray Smith,Spline Tutorial Notes,Lucasfilm/Pixar 技术备忘录 77,1983 年 5 月 8 日,http: //alvyray.com/Memos/CG/Pixar/spline77.pdf,2020 年 2 月 28 日访问。
10 . A. Robin Forrest,“关于表面的渲染”,Computer Graphics 13,第 3 期。2(1979 年 8 月):254。
11 . Alvin M. Welchons 和 William R. Krickenberger,Plane Geometry (New York: Ginn and Company, 1949), 7, 57。
12 . Robin Forrest,2017 年 6 月 12 日的谈话。
13 . Jim Blinn,2017 年 6 月 21 日的电子邮件;Martin Newell,数字图像合成中过程模型的利用,博士论文,计算机科学,犹他大学,1975 年夏季,无花果。28-29;Ivan Sutherland,2018 年 1 月 24 日的电子邮件。
14 . Herbert Freeman 和 Philippe P. Loutrel,“解决二维‘隐藏线’问题的算法”,IEEE Transactions on Electronics Computers EC-16,第 3 期。6(1967 年 12 月):784–789;Philippe P. Loutrel,“计算机绘制多面体的隐藏线问题的解决方案”,IEEE Transactions on Computers C-19,第 3 期。3(1970 年 3 月):205–213;Lawrence Gilman Roberts,“三维固体的机器感知”,博士论文,麻省理工学院电子工程系,马萨诸塞州剑桥市,1963 年 6 月。
15 . Jack Bresenham,“数字绘图仪的计算机控制算法”,IBM Systems Journal 4,第 4 期。1(1965):25-30;Bresenham 算法,https ://xlinux.nist.gov/dads/HTML/bresenham.html,2020 年 2 月 25 日访问。
16 . Jack Bresenham,2017 年 6 月 14 日的电子邮件;James D. Foley 和 Andries van Dam,交互式计算机图形学基础(剑桥,马萨诸塞州:Addison-Wesley,1982 年)。
17 . Glen J. Culler 和 Robert W. Huff,“使用在线计算机控制求解非线性积分方程”,1962 年 AFIPS 春季联合计算机会议论文集,129;Brian Dear,友好的橙色光芒:柏拉图系统的不为人知的故事和网络文化的黎明(纽约:万神殿,2017 年)。
18 . Vannevar Bush,“正如我们所想的那样”,大西洋月刊,1945 年 7 月,16。
19 . 布什,“正如我们所想的那样”,19-20。
20 . JCR Licklider,“人机共生,IRE Transactions on Human Factors in Electronics HFE-1(1960 年 3 月):7。
21 . Ivan Sutherland,2018 年 1 月 24 日的电子邮件。
22 . Douglas C. Engelbart,增强人类智力:概念框架,SRI 总结报告 AFOSR-3223(加利福尼亚州门洛帕克:斯坦福研究所,1962 年 10 月):ii,摘要。
23 . Paul Ryan,《神圣控制论》(纽约花园城:Anchor Press,1974 年),题词。
24 . Benj Edwards,“世界上第一个计算机艺术的前所未见的故事(这是一个性感的贵妇人)”,大西洋月刊,2013 年 1 月 24 日;IBM Sage 计算机广告,1960 年,https://www.youtube.com/watch?v= iCCL4INQcFo,2020 年 3 月 25 日访问。
25 . 斯图尔特·布兰德,“太空战争:计算机流浪者中的狂热生活和象征性死亡”,滚石杂志,1972 年 12 月 7 日。
26 . TX-0 计算机,麻省理工学院,1956-1960 年,https://www.youtube.com/watch?v= ieuV0A01--c ,2020 年 2 月 25 日访问。
27 . Stewart Brand, ed., Whole Earth Catalog (Menlo Park, CA: The Portola Institute, 1968);品牌,“太空战争”。
28 . Steven Levy,黑客:计算机革命的英雄(纽约花园城:Anchor Press/Doubleday,1984 年),157。
29 . Levy,Hackers,第 3 章(第 1 部分)。
30 . J. Martin Graetz,“太空战争的起源”,Creative Computing 7,第 7 期。8(1981 年 8 月):58;征费,黑客,18-19;维基百科,Thomas Stockham,于 2017 年 6 月 8 日访问。
31 . Levy,Hackers,45,第 3 章(第 1 部分)。
32 . Herbert Freeman,《鹅卵石:我的人生故事》(Xlibris Corp.,2009),17-22、40-41、112-115;Herb Freeman,电话,电子邮件,2018 年 1 月 14 日。
33 . 弗里曼,鹅卵石,39-51。
34 . Robin Forrest,2016 年 9 月会面。
35 . Robin Forrest,2017 年 4 月 5 日的电子邮件。
36 . Robin Forrest,电子邮件,2017 年 3 月 20 日,22 日;Rich Riesenfeld,2017 年 9 月 22 日的电子邮件。
37 . Daniel Cardoso Llach,愿景的构建者:软件和设计的想象力(纽约:Routledge,2015 年),56。
38 . Jim Blinn,2017 年 4 月 18 日的电子邮件。
39 . Cardoso Llach,愿景建设者,54 岁。
40 . Cardoso Llach,愿景的建设者,54-56。
41 . Daniel Cardoso Llach,“与 Robin Forrest 的对话”,草稿,2016 年 8 月 9 日,第 3 页。
42 . Cardoso Llach,“与 Robin Forrest 的对话”,3。
43 . 2002 年杰出服务奖:Bertram Herzog,https ://www.siggraph.org/about/awards/2002-service-award/,2020年 2 月 25 日访问;Siggraph 历史,https: //www.siggraph.org/about/history/ ,于 2020 年 2 月 25 日访问。
44 . Michel Landry,https ://www.ltechsolution.com/lanticonformisme-au-profit-de-la-creation/,2020 年 2 月 25 日访问(两段题词来源:第一个是我的翻译,第二个是帕斯卡尔翻译的托拉辛塔。
45 . Rich Riesenfeld,2017 年 9 月 22 日的电子邮件。
46 . 贝塞尔讣告,计算机辅助设计22,第 9(1990 年 11 月);Christian Boyer,电子邮件,2020 年 4 月 11 日至 20 日;Edmond De Andréa,“Grandes Figures: Pierre Bézier (Pa. 1927)”,Arts et Métiers 杂志,2005 年 12 月,第 52 页;Dugomier、Bruno Bazile 和 Yves Magne,La Naissance de la Renault 4CV(格勒诺布尔:Glénat,2017),14;Évelyne Gayme,“Les Oflags,Centers Intellectuels”,Inflexions 29,没有。2(2015 年):127。
47 . Pierre E. Bézier,“汽车行业现有系统的示例:Unisurf 系统” ,伦敦皇家学会会刊。系列 A,数学和物理科学321(1971):213,无花果。7-8。
48 . Cardoso Llach,“与 Robin Forrest 的对话”,2、13;Robin Forrest,2017 年 5 月 3 日的谈话。
49 . Paul de Faget de Casteljau,“De Casteljau 的自传:我在 Citroën 的时光”,计算机辅助几何设计16 (1999): 583–586。
50 . Hanns Peter Bieri 和 Hartmut Prautzsch,“序言”,计算机辅助几何设计16(1999):579–581;Jules Bloomenthal, ed., “Graphic Remembrances”, IEEE Annals of the History of the History of Computing 20, no. 2(1998):39;Robin Forrest,2017 年 4 月 9 日的电子邮件;维基百科,Paul de Casteljau,于 2019 年 12 月 23 日访问。
51 . Robin Forrest,2017 年 3 月 20 日,22 日的电子邮件。
52 . Ivan Sutherland,“Sketchpad, A Man-Machine Graphical Communication System”,博士论文,麻省理工学院电子工程系,马萨诸塞州剑桥市,1963 年 1 月;Ivan Sutherland,Skype 对话,2018 年 1 月 23 日。
53 . Timothy Johnson,Sketchpad III,与数字计算机的三维图形通信,硕士论文,麻省理工学院,EE 部门,剑桥,马萨诸塞州,1963 年 5 月;Tim Johnson,2017 年 4 月 29 日的电子邮件;Ivan Sutherland,Skype 对话,2017 年 5 月 9 日;David E. Weisberg,工程设计革命:永远改变工程实践的人员、公司和计算机系统。2008,http ://cadhistory.net/,2020 年 3 月 1 日访问,第 3 章,18-22。
54 . Tim Johnson,2017 年 4 月 20 日的电子邮件;萨瑟兰,画板,67-68;Ivan Sutherland,2017 年 5 月 2 日的电子邮件;Ivan Sutherland,Skype 对话,2017 年 5 月 9 日。
55 . Sutherland,画板,附录 E,154-160;Ivan Sutherland,2017 年 5 月 2 日的电子邮件。
56 . James F. Blinn,“图形管道之旅:爷爷,‘视口’是什么意思?” IEEE 计算机图形学和应用程序12,没有。1(1992 年 1 月):83-87;William Newman 和 Robert F. Sproull,交互式计算机图形学原理(旧金山:McGraw-Hill,1973 年),126-127。
57 . William A. Fetter,“艺术机器” ,商业艺术与设计杂志4,第 4 期。2(1962 年 2 月):36。
58 . Walter D. Bernhart 和 William A. Fetter,Planar Illustration Method and Apparatus,美国专利号 3,519,997,1970 年 7 月 7 日颁发,1961 年 11 月 13 日提交;Robin Oppenheimer,2017 年 6 月 16 日的电子邮件。
59 . Jim Blinn,2017 年 6 月 18 日的电子邮件。
60 . Fetter,“艺术机器”,36;Robin Oppenheimer,2017 年 6 月 21 日的电子邮件;维基百科,William Fetter,于 2017 年 9 月 29 日访问。
61 . Edward E. Zajac,“计算机制作的透视电影作为一种科学和交流工具” ,ACM 7 的通讯,第 7 期。3(1964 年 3 月):169–170;AT&T 技术频道,https://techchannel.att.com/play-video.cfm/2012/7/18/AT&T-Archives-First-Computer-Generated-Graphics-Film,2020年 2 月 25 日访问。
62 . Zajac,“电脑制作的透视电影”,170。
63 . Ivan Sutherland,Skype 对话,2018 年 1 月 23 日。
64 . Ivan Sutherland,2018 年 1 月 21 日的电子邮件;Ivan Sutherland,Skype 对话,2018 年 1 月 23 日。
65 . Tim Johnson,2017 年 3 月 24 日的电子邮件;JCR Licklider,“图形输入——技术调查”,1966 年加州大学洛杉矶分校计算机图形研讨会论文集,44。
66 . Fred N. Krull,“通用汽车公司计算机图形学的起源”,IEEE 计算历史年鉴16,第 1 期。3 (1994): 44-46; Weisberg,工程设计革命,第 3 章,22-25。
67 . Barrett Hargreaves,2014 年 11 月 4 日的电子邮件;Rich Riesenfeld,2017 年 9 月 23 日的电子邮件。
68 . Barrett Hargreaves,2017 年 5 月 18 日至 19 日的电子邮件。
69 . Barrett Hargreaves、John D. Joyce、George L. Cole、Ernest D. Foss、Richard G. Gray、Elmer M. Sharp、Robert J. Sippel、Thomas M. Spellman 和 Robert A. Thorpe,“图像处理硬件人机图形通信系统,1964 年 AFIPS 秋季联合计算机会议论文集,375;Barrett Hargreaves,2014 年 10 月 13 日、2017 年 5 月 19 日的电子邮件;J Edwin L.acks,“图形人机通信研究实验室”,1964 年 AFIPS 秋季联合计算机会议论文集,344;Ivan Sutherland,“计算机图形学:十个未解决的问题”,Datamation 12,第 1 期。5(1966 年 5 月):23。
70 . Barrett Hargreaves,2014 年 10 月 13 日的电子邮件。
71 . Robin Forrest,2017 年 3 月 20 日的电子邮件;Barrett Hargreaves,2017 年 5 月 18 日的电子邮件。
72 . 亲爱的,友好的橙色光芒。
73 . Ivan Sutherland,Skype 对话,2017 年 5 月 9 日。
74 . Licklider,“图形输入——技术调查”,44;画板,由 Ivan Sutherland 博士和 Alan Kay 发表评论,https://www.youtube.com/watch?v= 495nCzxM9PI,于2020 年 2 月 25 日访问。
75 . 约翰逊,画板 III。
76 . Tim Johnson,2017 年 3 月 24 日至 25 日的电子邮件。
77 . Tim Johnson,2017 年 3 月 30 日的电子邮件。
78 . Tim Johnson,2017 年 3 月 24 日的电子邮件。
79 . 罗伯茨,三维固体的机器感知。
80 . “回顾 II:麻省理工学院、林肯实验室和哈佛计算机图形学的早期研究”,Siggraph '89 小组会议,Siggraph '89,波士顿,7 月 31 日至 8 月。4, 1989, 56–59。
81 . “Larry Roberts,研究员,”计算机历史博物馆(网站),https ://computerhistory.org/profile/larry-roberts/?alias=bio&person=larry-roberts ,2020 年 2 月 25 日访问。
82 . 萨瑟兰,画板,132-133,图。9.8;Ivan Sutherland,Skype 对话,2017 年 5 月 9 日。
83 . Jasia Reichardt, ed., Cybernetic Serendipity: The Computer and the Arts (Studio International Special Issue, London, July 1968), 5.
84 . Kenneth C. Knowlton,“制作动画电影的计算机技术”,1964 年 AFIPS 春季联合计算机会议论文集,67-87;制作动画电影的计算机技术,https ://techchannel.att.com/play-video.cfm/2012/9/10/AT&T-Archives-Computer-Technique-Production-Animated-Movies,2020 年 2 月 25 日访问; 计算机动画编程,https ://techchannel.att.com/play-video.cfm/2012/9/17/AT&T-Archives-Programming-of-Computer-Animation,2020 年 2 月 25 日访问。
85 . Grant D. Taylor,当机器制造艺术时:计算机艺术的麻烦历史(纽约:Bloomsbury Academic,2014 年)。
86 . Marceli Wein,2017 年 7 月 3 日的电子邮件;http://compellingjewishstories.blogspot.com/2013/03/fifteen-journeys-warsaw-to-london-by.html,2020年 2 月 25 日访问。
87 . Cardoso Llach,“与 Robin Forrest 的对话”,17。
88 . Cybernetic Serendipity,http: //www.historyofinformation.com/detail.php?entryid=1089,2020年 2 月 25 日访问。
89 . Reichardt,控制论机缘巧合,66-68、86-90、92-93、95-96。
90 . Ronald Baecker,“交互式计算机介导动画”,博士论文,麻省理工学院电子工程系,马萨诸塞州剑桥市,1969 年 3 月,第 6 页。
91 . Ron Baecker,2019 年 8 月 5 日的电子邮件。
92 . Baecker,交互式计算机介导动画,4;Ron Baecker,2017 年 5 月和 2019 年 8 月 5 日的电子邮件;Genesys:交互式计算机介导动画系统, https://www.youtube.com/watch?v= GYIPKLxoTcQ,2020 年 2 月 25 日访问;Tim Johnson,2017 年 5 月的电子邮件;Eric Martin,2015 年 9 月 28 日的电子邮件。
93 . Baecker,“交互式计算机介导动画”;Ronald Baecker,“Picture-Driven Animation” ,1969 年 AFIPS 春季联合计算机会议论文集,273-288;萨瑟兰,画板,132。
94 . Ephraim Cohen,2017 年 5 月 25 日的电子邮件。
95 . Baecker,“图片驱动的动画”,278。
97 . Marceli Wein,2017 年 7 月 3 日的电子邮件。
98 . Marceli Wein,Marceli Wartime,2015 年 3 月 11 日,19 页的自传,11-14;Jim Blinn,2016 年 6 月 21 日的电子邮件。
99 . 英特尔公司,与 Gordon Moore 的对话节选:摩尔定律,http ://large.stanford.edu/courses/2012/ph250/lee1/docs//Excepts_A_Conversation_with_Gordon_Moore.pdf,2020年 2 月 28 日访问;Gordon E. Moore,“将更多组件塞入集成电路”,电子学38(1965 年)。
100 . Rachel Courtland,“熔锡解决方案”,IEEE Spectrum,2016 年 11 月,28-33、41;英特尔公司,三栅极晶体管演示文稿,2011 年 4 月 19 日,http://www.intel.com/content/dam/www/public/us/en/documents/backgrounders/standards-22nm-3d-tri-gate -transistors-presentation.pdf,2020 年 2 月 29 日访问。
101 . Jim Blinn,2019 年 3 月 23 日的电子邮件;Arthur C. Clarke,《城市与星辰》(纽约:Signet Books,1957 年),47-48。
102 . Ivan Sutherland,“终极展示” ,1965 年 IFIP 大会论文集,508。
103 . Jaron Lanier,《新事物的黎明:现实与虚拟现实的相遇》(纽约:Henry Holt,2017 年),43;Ivan Sutherland,“头戴式三维显示器” ,1968 年 AFIPS 秋季联合计算机会议论文集,759;Ivan Sutherland 和 Bob Sproull,《Virtual Reality Before It Have That Name》,计算机历史博物馆,1996 年 3 月 19 日,https://computerhistory.org/ivan-sutherland-virtual-reality-before-it-had-that-name- playlist/,2020 年 3 月 1 日访问。
104 . Sutherland,“头戴式三维显示器”,762。
105 . 萨瑟兰和斯普劳尔,在它有这个名字之前的虚拟现实。
106 . Jim Kajiya,2017 年 4 月 24 日的电子邮件;Sutherland,“计算机图形学:十个未解决的问题”。
107 . Ivan Sutherland,Skype 对话,2018 年 1 月 23 日。
1 . 图 7.1:GE,计算机图像生成,模拟和控制系统部,通用电气公司,佛罗里达州代托纳比奇,19 页彩色营销手册(包括封面),ca。1977;GE–NASA,最终报告,视觉三视图太空飞行模拟器,合同 NAS 9-1375,GE,国防电子部门,电子实验室,纽约州伊萨卡,1964 年 8 月 1 日。
2 . Gene Youngblood,扩展电影(纽约:EP Dutton,1970),252。
3 . Youngblood,扩展电影,205。
4 . Youngblood,扩展电影,205;Gene Youngblood,2019 年 3 月 12 日的电子邮件。
5 . Youngblood,扩展电影,252。
6 . Jim Blinn,2018 年 1 月的对话,2018 年 2 月 9 日的电子邮件;Zareh Gorjian,2018 年 1 月 3 日的电子邮件。
7 . NASA,“为 Mariner 4 图像数据着色”,https ://mars.nasa.gov/resources/20284/coloring-the-mariner-4-image-data/,2020 年 2 月 26 日访问;NASA,“火星电视摄像机”,https ://nssdc.gsfc.nasa.gov/nmc/experiment/display.action?id= 1964-077A-01,2020 年 2 月 26 日访问。
8 . Robert B. Leighton、Bruce C. Murray、Robert P. Sharp、J. Denton Allen 和 Richard K. Sloan,Mariner IV 火星图片,NASA 技术报告 32-884,Mariner Mars 1964 项目报告:电视实验第一部分。调查员报告,JPL,1967 年 12 月 15 日,xi,59。
9 . Leighton 等人,Mariner IV Pictures of Mars,29;https://photojournal.jpl.nasa.gov/catalog/PIA14033,2020年 2 月 26 日访问。
10 . GE-NASA,视觉三视图太空飞行模拟器;罗伯特舒马克,2018 年 2 月 22 日的电子邮件。
11 . GE-NASA,视觉三视图太空飞行模拟器,1、3;罗伯特舒马克,2018 年 2 月 14 日,16 日的电子邮件。
12 . 罗伯特舒马克,2018 年 2 月 16 日的电子邮件。
13 . GE-NASA,视觉三视图太空飞行模拟器,3;罗伯特舒马克,2018 年 2 月 14 日的电子邮件。
14 . Youngblood,扩展电影,电脑电影。
15 . Jasia Reichardt 编辑,Cybernetic Serendipity: The Computer and the Arts(Studio International 特刊,伦敦,1968 年 7 月),65;Youngblood,扩展电影,215–222。
16 . 青金石,https://www.youtube.com/watch?v= kzniaKxMr2g ,2020 年 2 月 26 日访问;二进制位模式,https://archive.org/details/binarybitpatterns,2020年 2 月 26 日访问。
17 . Youngblood,扩展电影,250。
18 . WJ Bouknight,一种用于生成半色调计算机图形演示的改进程序(Urbana:伊利诺伊大学厄巴纳分校,1969 年 9 月 1 日),iv。
19 . Jim Blinn,2019 年 4 月 4 日的电子邮件;Bouknight,一种改进的半色调生成程序;GE–NASA,第六季度报告,对临时视觉太空飞行模拟器的修改,合同 NAS 9-3916,GE,国防电子部门,电子实验室,纽约州伊萨卡,1966 年 7 月,i, 1, 5;Robin Forrest,2019 年 4 月 11 日 29 日的电子邮件;Ted Nelson,Computer Lib/Dream Machines(芝加哥:Ted Nelson,1974),108;Martin Newell,2019 年 4 月 12 日的电子邮件;Chris Wylie、Gordon Romney 和 David Evans,“计算机的半色调透视图” ,1967 年 AFIPS 秋季联合计算机会议论文集,56-57。
20 . GE-NASA,第九季度报告,对临时视觉航天模拟器的修改,合同 NAS 9-3916,GE,国防电子部门,电子实验室,纽约州伊萨卡,1967 年 4 月 20 日,ii, 1, 6-7;A. Johnson 少校,“电子实验室(1944 年至 1993 年)” ,国防和太空进展:通用电气公司航空航天集团的历史(MA Johnson,1993 年),540;Robert A. Schumacker、Brigitta Brand、Maurice G. Gilliland 和 Werner H. Sharp,研究将计算机生成的图像应用于视觉模拟,报告 AFHRL-TR-69-14,佛罗里达州代托纳比奇:通用电气公司,9 月。 1969 年,第 113 页。
21 . Don Greenberg,2018 年 2 月的电话;Rod Rougelot,2018 年 2 月 21 日的电子邮件。
22 . Rodney S. Rougelot,“通用电气计算机彩色电视显示器”,计算机图形学中的相关概念:第二届伊利诺伊大学计算机图形学会议论文集,编辑。E. Faiman 和 J. Nievergelt(Urbana:伊利诺伊大学出版社,1969 年),264–265。
23 . Evans & Sutherland Computer Corporation History,http ://www.fundinguniverse.com/company-histories/evans-sutherland-computer-corporation-history/,2020 年 2 月 26 日访问;约翰逊,“电子实验室(1944 年至 1993 年)”,540–541。
24 . 罗伯特舒马克,2019 年 8 月 11 日的电子邮件。
25 . 罗伯特舒马克,2019 年 8 月 11 日的电子邮件。
26 . Alvy Ray Smith,引自 Cynthia Goodman,“计算机时代的艺术”,Facsimile 3, no. 10(2009 年 10 月),15;时代杂志,1986 年 9 月 1 日,“计算机:两个台灯的爱”,66。
27 . 尼尔·斯蒂芬森(Neal Stephenson), 《坠入地狱》( Fall, or Dodge in Hell)(纽约:HarperCollins,2019 年),18-19。
28 . Rod Rougelot,2018 年 2 月 21 日的电子邮件。
29 . 康奈尔透视,http://www.graphics.cornell.edu/online/cip/,2020年 2 月 26 日访问;Donald P. Greenberg,“建筑中的计算机图形学”。科学美国人230,没有。5(1974 年 5 月):98–106;Donald P. Greenberg,“建筑与工程中的计算机图形学”,在美国宇航局的一份未知出版物中,显然是论文号。1975 年 17 月,https://archive.org/details/nasa_techdoc_19760009741/,2020年 3 月 1 日访问,358;Marc Levoy,2017 年 5 月 7 日的电子邮件。
30 . Edwin Catmull,“计算机生成电影系统” ,ACM 年会论文集,卷。1, 422–431,马萨诸塞州波士顿,1972 年 8 月 1 日;Ed Catmull,2019 年 5 月 28 日,4 月 8 日的电子邮件;亨利·福克斯,2019 年 7 月 31 日的谈话;Futureworld,https://www.youtube.com/watch? v=QfRAfsK5cvU ,2020 年 2 月 26 日访问;Marc Levoy,2017 年 5 月 7 日的电子邮件;Frederic Ira Parke,人脸计算机生成动画,硕士论文,犹他大学,1972 年 6 月;Frederic Ira Parke,“人脸的计算机生成动画”。ACM 年会论文集,卷。1, 451–457,马萨诸塞州波士顿,1972 年 8 月 1 日;Fred Parke,2020 年 3 月 23 日的电子邮件。
31 . Edwin Catmull,“曲面计算机显示的细分算法”,博士论文,犹他大学,1974 年 12 月;Wolfgang Straßer, Schnelle Kurven- und Flächendarstellung auf grafischen Sichtgeräten,博士工程师论文,柏林工业大学,1974 年 4 月 26 日提交,1974 年 9 月 5 日批准。
32 . Lance Williams,“在曲面上投射曲面阴影”,Computer Graphic 12,第 12 期。3(1978 年 8 月):270–274。
33 . Isabelle Bellin,“计算机生成的图像:Gouraud 阴影的长寿手掌”[已翻译],2008 年 9 月 15 日发表在https://interstices.info/images-de-synthese-palme-de-la-longevite- pour-lombrage-de-gouraud/,2020 年 3 月 1 日访问;Henri Gouraud,“曲面的连续着色”,IEEE Transactions on Computers C-20,no. 6(1971 年 6 月):87-93。
34 . John F. Hughes、Andries van Dam、Morgan McClure、David F. Sklar、James D. Foley、Steven K. Feiner 和 Kurt Akely,计算机图形学:原理与实践,第 3 版(上马鞍河,新泽西州:Addison-卫斯理出版公司,2014);Bui Tuong Phong,“计算机生成图片的照明” ,ACM 18 通讯,第 1 期。6(1975 年 6 月):311–317。
35 . 迪克舒普,1995-1999 年的个人采访。
36 . Alvy Ray Smith,施乐 PARC 日记,1974 年 5 月 8 日至 1 月。1975 年 16 月 16 日,http: //alvyray.com/DigitalLight/XeroxPARC_hire_diary_entries.pdf,2020 年 5 月 14 日访问,第 67、70-71、74、76-78、85、94-95 页;Alvy Ray Smith,施乐 PARC 招聘采购订单,1974 年 8 月 12 日,http: //alvyray.com/DigitalLight/XeroxPARC_PO_Alvy_hire_1974.pdf,2020 年 5 月 14 日访问。
37 . William J. Kubitz,三色制图,博士论文,报告编号。282,计算机科学系,伊利诺伊大学厄巴纳分校,1968 年 9 月;William J. Kubitz 和 WJ Poppelbaum,“三色制图:具有自动着色能力的显示系统”,信息显示6(1969 年 11 月至 12 月):76-79;Edgar Meyer,“A Crystallographic 4-Simplex”,American Crystallographic Association Living History—Edgar Meyer,2014 年春季,38,https ://www.amercrystalassn.org/h-meyer_memoir,2020 年 3 月 1 日访问;Joan E. Miller,个人通讯,1978 年 7 月;D. Ophir、S. Rankowitz、BJ Shepherd 和 RJ Spinrad,“BRAD: The Brookhaven Raster Display” ,ACM 通讯11,没有。6(1968 年 6 月):415–416;Alvy Ray Smith, Paint , Technical Memo No. 7, Computer Graphics Lab, NYIT, July 1978, 13, appendix C; https://www.youtube.com/watch?v=njp0ABKwrXA,2020年 2 月 26 日访问。
38 . Ramtek,编程手册,9000 系列图形显示系统,加利福尼亚州桑尼维尔:1977 年 3 月,附录 A,2;Ramtek,系统描述手册,RM-9000 图形显示系统,加利福尼亚州桑尼维尔:1977 年 11 月,第 1 章。1、5-8;Richard G. Shoup,“SuperPaint: An Early Frame Buffer Graphics System”,IEEE Annals of the History of Computing 23,no. 2(2001 年 4 月至 6 月):37。
39 . SuperPaint 系统,http ://web.archive.org/web/20020110013554/http://www.rgshoup.com:80/prof/SuperPaint/ ,于 2020 年 2 月 26 日访问。
40 . Alvy Ray Smith,“色域变换对”,计算机图形学12,第 3(1978 年 8 月):12-19。
41 . Preston Blair, Animation (Walter T. Foster, ca. 1940s), http://www.welcometopixelton.com/downloads/Animation%20by%20Preston%20Blair.pdf , 2020 年 3 月 1 日, 22, 24 日访问。
42 . http://alvyray.com/Pixar/documents/Disney1977Visit_EdAlvyDick.pdf,2020年 2 月 26 日访问;Ron Baecker,2019 年 8 月 5 日的电子邮件;Eric Martin,2015 年 9 月 28 日的电子邮件;https://www.youtube.com/watch?v=nHkxem785B4,2020年 2 月 26 日访问。
43 . David DiFrancesco,2018 年 4 月 4 日的电子邮件;http://www.scanimate.net/,2020年 2 月 26 日访问;https://www.youtube.com/watch?v=SGF0Okaee1o,2020年 2 月 26 日访问。
44 . David DiFrancesco 和 Alvy Ray Smith,NEA 提案,https: //alvyray.com/DigitalLight/NEA_Proposal_Smith_DiFrancesco_1974.pdf,2020年 5 月 14 日访问。
45 . 斯图尔特·布兰德,“太空战争:计算机流浪汉中的狂热生与象征性死亡”,滚石杂志,1972 年 12 月 7 日;Tekla S. Perry 和 Paul Wallich,“在 PARC 内部:‘信息架构师’”,IEEE Spectrum,1985 年 10 月,62-75;史密斯,施乐 PARC 个人日记,98。
46 . Michael A. Hiltzik,《闪电经销商:Xerox Parc 和计算机时代的黎明》(纽约:HarperCollins,2009 年);Douglas K. Smith 和 Robert C. Alexander,摸索未来:施乐如何发明,然后被忽视,第一台个人计算机(纽约:William Morrow,1988 年),176。
47 . Jim Kajiya,2017 年 4 月 24 日的电子邮件。
48 . Laurence Gartel 和 Joseph L. Streich,“NYIT 让计算机为电视工作”,毫米,1981 年 6 月,最后一页。
49 . Michael Rubin,Droidmaker: George Lucas and the Digital Revolution(佛罗里达州盖恩斯维尔:Triad Publishing,2006),103–112;Alvy Ray Smith,Schure Genealogy(伯克利:ars longa,2019 年),http ://alvyray.com/Schure/,2020 年3 月 2 日访问。
50 . James K. Libbey, Alexander P. de Seversky and the Quest for Air Power (Washington, DC: Potomac Books, 2013), 43.
51 . Alexander P. de Seversky,《空中力量的胜利》(纽约:西蒙和舒斯特,1942 年);Neal Gabler,沃尔特·迪斯尼:美国想象力的胜利(纽约:Alfred A. Knopf,2006 年);Libbey, Alexander P. de Seversky , 95, 163, 212, 273, ch. 13; 通过空中力量取得胜利(1943),https://archive.org/details/VictoryThroughAirPower,2020年 2 月 26 日访问。
52 . 《纽约时报》,“夫人。杜邦庄园的特邀买家:英国空军部长的妻子通过她的兄弟霍华德 C.菲普斯购买:支付的价格是 470,000 美元:母亲说,现在在国外的格斯特夫人会惊讶 [原文如此] 了解收购,” 1921 年 4 月 26 日;纽约时报,“惠特尼庄园将成为校园”,1963 年 9 月 5 日;戴安娜·萨曼(Diana Shaman),“在该地区:长岛:大学前庄园规划的 7 栋房屋”,《纽约时报》,2001 年 7 月 29 日,房地产,第 7 页。
53 . 鲁宾,Droidmaker,103-141。
54 . Llisa Demetrios,2017 年 5 月 15 日的电子邮件;Charles Eames 和 Ray Eames,计算机视角:计算机时代背景,编辑。Glen Fleck(马萨诸塞州剑桥:哈佛大学出版社,1973 年;1990 年出版);拉里·罗伯茨,2017 年 5 月 8 日的电子邮件;Ivan Sutherland,Skype 对话,2017 年 5 月。
55 . Edwin Catmull,与 Amy Wallace,Creativity, Inc.:克服阻碍真正灵感的看不见的力量(纽约:兰登书屋,2014 年),20-22。
56 . Gene Youngblood,2018 年 7 月 6 日的电子邮件;https://www.studiointernational.com/index.php/thinking-machines-art-and-design-in-the-computer-age-review-moma,2020年 2 月 26 日访问。
57 . Christine Barton,2019 年 3 月 12 日的电子邮件;http://magazines.marinelink.com/Magazines/MaritimeReporter/198912/content/msicaorf-trains-accidents-200573,2020年 2 月 26 日访问;维基百科,纽约港,2019 年 3 月 12 日访问。
58 . Joseph J. Puglisi、Jack Case 和 George Webster,“CAORF 船舶操作中心 (SOC) — 计算机辅助运筹研究设施 (CAORF) 的船用发动机和甲板模拟的最新进展”,国际海洋模拟和船舶操纵会议MARSIM 2000,会议论文集,佛罗里达州奥兰多,2000 年 5 月 8 日至 12 日,第 61、66 页。
59 . Rod Rougelot 和 Robert Schumacker,2018 年 2 月 27 日采访。
60 . Christine Barton,2019 年 5 月 12 日的电子邮件。
61 . Christine Barton,2017 年 4 月 14 日的电子邮件;史密斯,油漆,附录 B。
62 . Jim Blinn,2019 年 4 月 6 日的电子邮件;Garland Stern,2017 年 6 月 15 日的电子邮件;Lance Williams,2017 年 6 月 15 日的电子邮件。
63 . Henry Fuchs,电子邮件和对话,2019 年 7 月 31 日。
64 . Louis Schure,“纽约理工学院” ,图像制作计算机(伦敦:爱思唯尔,1981 年),73-76。
65 . Garland Stern,“SoftCel — 光栅扫描图形在传统 Cel 动画中的应用”,《计算机图形学》第 13 期,第 3 期。2(1979 年 8 月):284–288。
66 . Alvy Ray Smith,“Tint Fill”,Computer Graphics 13,第 10 期。2(1979 年 8 月):276–283。
67 . 史密斯,油漆;Alvy Ray Smith,“数字绘画系统:轶事和历史概述”,IEEE 计算历史年鉴23,第 3 期。2(2001 年 4 月至 6 月):4-30。
68 . Jim Blinn,2019 年 3 月 30 日的电子邮件。
69 . 史密斯,油漆,附录 B。
70 . James F. Blinn,“Jim Blinn 的角落:我如何度过暑假—1976”,IEEE 计算机图形学和应用程序12,第 12 期。6(1992 年 11 月):87-88。
71 . James F. Blinn,“褶皱表面的模拟”,计算机图形学12,第 3 期。3(1978 年 8 月):286–292;Jim Blinn,2019 年 1 月 31 日的电子邮件。
72 . Jim Blinn,2019 年 4 月 6 日的电子邮件;Ephraim Cohen,2017 年 6 月 22 日的电子邮件;Ruth Leavitt, ed., Artist and Computer (New York: Harmony Books, 1976), 封面, 61–64.
73 . David DiFrancesco,2018 年 5 月 3 日的电子邮件;Tom Duff,个人谈话,2019 年 3 月;Ken Thompson,2019 年 3 月 13 日的电子邮件;维基百科,Unix,2018 年 5 月 3 日访问。
74 . 比尔·里夫斯,2018 年 11 月 15 日的电子邮件。
75 . 沃尔特·艾萨克森、史蒂夫·乔布斯(纽约:西蒙和舒斯特,2011 年);David A. Price,The Pixar Touch: The Making of a Company(纽约:Alfred A. Knopf,2008 年)。
76 . Ralph Guggenheim,2016 年 8 月 5 日的电子邮件。
77 . Marc Levoy,2018 年 5 月 30 日的电子邮件;史密斯,“色域变换对”;维基百科,Marc Levoy,于 2018 年 5 月 9 日访问。
78 . David DiFrancesco,2016 年 8 月 26 日的电子邮件。
79 . Alvy Ray Smith,Vidbits,录像带,Xerox PARC,1974 年 12 月。于 1975 年在纽约现代艺术博物馆展出,并于 1975 年在纽约的 WNET 电视节目VTR中展出,2020 年 8 月 15 日在 YouTube 上访问,https://www.youtube.com/watch?v=47GSOspoTGo。
80 . Jesse Pires, ed., Dream Dance: The Art of Ed Emshwiller (Philadelphia: Lightbox Film Center Anthology Editions, 2019)。
81 . 维基百科,James H. Clark,于 2019 年 7 月 31 日访问。
82 . Christine Freeman,2019 年 4 月 19 日的电子邮件。
83 . Alvy Ray Smith,“1977 年 1 月 3 日迪士尼朝圣记录”,http: //alvyray.com/Pixar/documents/Disney1977Visit_EdAlvyDick.pdf,2020 年 3 月 2 日访问,第 2 期。
84 . 史密斯,“1977 年 1 月 3 日迪斯尼朝圣笔记”,3-4。
85 . 加布勒,华特迪士尼,546、590。
1 . Ralph Guggenheim,2016 年 8 月 5 日的电子邮件。
2 . Ed Catmull,2019 年 3 月 19 日的电子邮件。
3 . Jim Blinn,2019 年 3 月 30 日的电子邮件。
4 . David DiFrancesco,“用于电影的高分辨率三色激光扫描仪” ,摄影和电子图像质量研讨会论文集(剑桥:皇家摄影学会科学委员会,1984 年 11 月),126-135。
5 . Nick England,“Ikonas 图形系统——世界上第一个 GPGPU”,nd,http://www.virhistory.com/ikonas/index.htm,2020年 2 月 19 日访问。
6 . 罗伯特 L. 库克,“树荫”,计算机图形学18,不。3(1984 年 7 月):223–231;Ken Perlin,“图像合成器”,《计算机图形学》第 19 期,第 1 期。3(1985 年 7 月):287–296。
7 . 尼尔·斯蒂芬森,秋季;或者,在地狱道奇(纽约:HarperCollins,2019 年),18。
8 . Arthur Appel,“固体着色机渲染的一些技术” ,1968 年 AFIPS 春季联合计算机会议论文集,37-45;Robert A. Goldstein 和 Roger Nagel,“3-D 视觉模拟”模拟(1971 年 1 月),25-31;Matt Pharr、Wenzel Jakob 和 Greg Humphreys,基于物理的渲染;从理论到实施,http://www.pbr-book.org/3ed-2018/contents.html,2020 年 2 月 20 日访问;Turner Whitted,“一种用于阴影显示的改进照明模型” ,ACM 23 通讯,第 3 期。6(1980 年 6 月):343–349;光线追踪先驱Turner Whitted解释了他是如何偶然发现全球照明的,https://blogs.nvidia.com/blog/2018/08/01/ray-tracing-global-illumination-turner-whitted/,2020年 2 月 20 日访问。
9 . 维基百科,Gilles Tran,于 2019 年 12 月 19 日访问。
10 . DR Williams 和 R. Collier,“人类光感受器马赛克空间采样的后果”,Science 221(1983 年 7 月 22 日):385–387;JI Yellott Jr.,“恒河猴视网膜感光器采样的光谱结果”,《科学》 221(1983 年 7 月 22 日):382–385。
11 . Robert L. Cook,“计算机图形学中的随机抽样”,ACM Transactions on Graphics 5,第 5 期。1 (1986): 51–72; Rodney Stock,“My Inspiration for Dithered (Nonuniform) Sampling”,Jules Bloomenthal 编辑,“Graphic Remembrances”,IEEE Annals of the History of the History 20,no. 2 (1998): 49–50; Yellott,“光感受器采样的光谱后果”。
12 . 头发模拟概述,https ://www.khanacademy.org/partner-content/pixar/simulation/hair-simulation-101/v/hair-simulation-intro,2020 年 2 月 19 日访问。
13 . James T. Kajiya,“渲染方程”,计算机图形学20,第 2 期。4(1986 年 8 月):143–149。
14 . Rob Cook、Tom Porter 和 Loren Carpenter,“分布式光线追踪”,计算机图形学18,第 3 期。3(1984 年 7 月):137–145;科学 84,7月至 8 月。1984 年,封面。
15 . Tom Duff,2016 年 8 月 3 日的电子邮件。
16 . William T. Reeves,“粒子系统——一种模拟一类模糊对象的技术”,ACM Transactions on Graphics 2,第 2 期。2(1983 年 4 月):91–108。
17 . Jim Blinn,2019 年 3 月 30 日的电子邮件。
18 . Alvy Ray Smith,“星际迷航 II 的特殊效果:创世纪演示,计算机图形的即时进化”,美国电影摄影师63,第 3 期。10(1982 年 10 月):1038–1039、1048–1050。
19 . Leo N. Holzer,http://jimhillmedia.com/guest_writers1/b/leo_n_holzer/archive/2010/12/15/former-disney-ceo-ron-miller-recalls-his-own-quot-tron-quot-legacy .aspx,2020 年 2 月 19 日访问;Ron Miller 讣告,https: //www.thewrap.com/ron-miller-disney-ceo-walt-son-in-law-dies/,2020年 2 月 19 日访问。
21 . 动画世界杂志,https ://www.awn.com/mag/issue3.8/3.8pages/3.8lyonslasseter.html,2020 年 2 月 20 日访问;《大众力学》,2010 年 12 月 9 日,https ://www.popularmechanics.com/culture/movies/a11706/are-tron-legacys-3d-fx-ahead-of-their-time/,2020 年 2 月 20 日访问.
22 . MAGI/SynthaVision 采样器 (1974),https ://youtu.be/jwOwRH4JpXc ;MAGI Synthavision 演示卷轴 (1980),https ://youtu.be/lAYaX6NuI4M ;MAGI Synthavision 1984 Demo Reel,https: //youtu.be/Ivk_LPQP6Ag ,均于 2020 年 2 月 20 日访问。
23 . Ken Perlin,2019 年 2 月 17 日的电子邮件;Ken Perlin,http: //blog.kenperlin.com/?p=2314,于2020 年 2 月 20 日访问。
24 . Jim Blinn,2019 年 3 月 29 日的电子邮件;Richard Chuang,PDI 25 年—1980 年至 2005 年,幻灯片,2006 年 11 月 15 日,PDI/DreamWorks Animation,https: //web.archive.org/web/20170225112150/https://web.stanford.edu/class/ ee380/Abstracts/061115-RichardChuang.pdf,2020 年 2 月 20 日访问;Richard Chuang,电子邮件,2019 年 3 月 31 日;Glenn Entis,2018 年 9 月 2 日的电子邮件。
25 . Wayne E. Carlson,计算机图形和动画的历史:回顾性概述(俄亥俄州哥伦布市:俄亥俄州立大学,2017 年),180–185;Gary Demos,“我在计算机图形学早期探索中的个人历史”,Visual Computer 21(2005):961–978;Bob Sproull,2019 年 7 月 25 日的电子邮件;Ivan Sutherland,Skype 对话,2017 年 5 月 9 日,2018 年 1 月 23 日。
26 . Ed Catmull,2019 年 3 月 19 日的电子邮件;David A. Price,“Michael Crichton 的‘西部世界’如何开创现代特效”,《纽约客》 ,2013 年 5 月 14 日,https://www.newyorker.com/tech/annals-of-technology/how-michael-crichtons-westworld-pioneered-modern-special-effects,2020 年 3 月 2 日访问。
28 . Mike Seymour,fxguide,https: //www.fxguide.com/fxfeatured/founders-series-richard-chuang/,2020 年2 月 20 日访问。
29 . 卡尔森,计算机图形和动画史,181;Loren Carpenter,2018 年 6 月 12 日的电子邮件。
30 . Ed Catmull,2019 年 3 月 19 日的电子邮件。
31 . Karen Paik,走向无限和超越!皮克斯动画工作室的故事(旧金山:编年史书籍,2007 年),39-40。
32 . 我拥有的文件:Laurin Herr,1985 年 8 月 16 日、1984 年 9 月 27 日的报告;小学馆,注释 1985 年 7 月 27-30 日,1985 年 12 月,1986 年 1 月。
33 . Richard I. Levin,低买高卖,早收晚付:财务生存经理指南(旧金山:Prentice Hall,1983 年);WR Purcell Jr.,了解公司财务:图形方法(旧金山:Barnes & Noble Books,1983 年)。
34 . 我拥有的文件:“GFX Inc. 动画服务业务计划”,1985 年 1 月。
35 . Adam Fisher,《天才之谷:未经审查的硅谷历史》(纽约:十二 [Hachette],2018 年),198。
36 . 作者拥有的文件:“Potential Investors III”,1985 年 6 月 21 日。
37 . 作者拥有的文件:“Potential Investors I”,1985 年 6 月 21 日。
38 . Robert A. Drebin、Loren Carpenter 和 Pat Hanrahan,“体积渲染”,计算机图形学22,第 3 期。4(1988 年 8 月):65–74。
39 . 作者拥有的文件:签署的意向书,1985 年 11 月 7 日。
40 . Doron P. Levin,不可调和的差异:Ross Perot 与通用汽车(波士顿:Little, Brown,1989),250–261;Marina von Neumann Whitman,2013 年 5 月的电子邮件。
41 . 我拥有的文件:皮克斯 1986 年的股票购买计划,附表 B-1;皮克斯创始文件http://alvyray.com/Pixar/于 2020 年 2 月 20 日访问。
42 . 维基百科,计算机动画制作系统,2018 年 9 月 2 日访问。
43 . Christine Freeman,2019 年 4 月 18 日的电子邮件;Alvy Ray Smith,Altamira Formation Journal,1991 年 3 月 6 日和 3 月 21 日的条目。
44 . Jim Lawson,2019 年 4 月 2 日的电子邮件。
45 . Infoworld,1988 年 5 月 23 日,第 6 页,https: //books.google.com/books?id=4T4EAAAAMBAJ&pg=PA6,2020 年2 月 20 日访问;维基百科,Walkman,于 2019 年 4 月 3 日访问。
46 . Rob Cook,2019 年 6 月 1 日的电子邮件。
47 . Pat Hanrahan 和 Jim Lawson,“一种用于着色和照明计算的语言”,计算机图形学24,第 3 期。4(1990 年 8 月):289–298;Steve Upstill,The RenderMan ™ Companion: A Programmer's Guide to Realistic Computer Graphics (Menlo Park, CA: Addison-Wesley, 1990)。
48 . Upstill,The RenderMan ™ Companion,vii。
49 . Loren Carpenter,2018 年 9 月 3 日的电子邮件。
50 . Walter Isaacson, Steve Jobs(纽约:Simon & Schuster,2011),244–245。
51 . Smith,Altamira Formation Journal,1991 年 7 月 1 日、9 月 6 日和 9 月 9 日的条目。
52 . 美国专利第 4,897,806 号,计算机图形学中的伪随机点采样技术,1990 年 1 月 30 日颁发。
53 . 燃烧的爱,https://youtu.be/O7SycLUH-NM;运动,https: //youtu.be/gATcdqgkWVA;工业歌剧院,https://youtu.be/qLEg_P5Crt0;PDI 历史汇编,https://www.youtube.com/playlist? list=PLJv789O10fmzl_YpDecrd3wI1qUg7XD4M ,均于 2020 年 2 月 20 日访问。
55 . 维基百科,太平洋数据图像,2019 年 3 月 19 日访问。
58 . 费舍尔,天才谷,203。
59 . 皮克斯 IPO 招股说明书,1995 年 11 月 25 日,第 47 页;维基百科,皮克斯,脚注 3(“皮克斯联合创始人证明”),2018 年 6 月 23 日访问。
1 . G. Spencer Brown,《形式法则》(纽约:Bantam Books,1973 年),3。
3 . Jonghyun Kim、Youngmo Jeong、Michael Stengel、Kaan Aksit、Racherl Albert、Ben Boudaoud、Trey Greer、Joohwah Kim、Ward Lopes、Zander Majercik、Peter Shirley、Josef Spjut、Morgan McGuire 和 David Luebke,“注视点 AR:动态注视点增强现实显示,” ACM Transactions on Graphics 38,第 3 期。4(2019 年 7 月):第 99 条。
5 . Alvy Ray Smith,“无相机电影,或数字人类在等待中”,《科学美国人》 ,2000 年 11 月,72-78。
6 . 芭芭拉·罗伯逊(Barbara Robertson),“旧的又是新的”,《计算机图形学世界》第 32 期,第 3 期。1(2009 年 1 月),http://www.cgw.com/Publications/CGW/2009/Volume-32-Issue-1-Jan-2009-/Whats-Old-is-New-Again.aspx,访问 3 月2020 年 1 月 1 日。
7 . Barbara Robertson,“Face Lift”,计算机图形世界,2019 年冬季,http ://www.cgw.com/Publications/CGW/2019/Winter-2019/Face-Lift.aspx,2020 年 3 月 1 日访问;这 10 位演员如何为他们的电影减龄,https://www.youtube.com/watch?v= twKiEzjeH-M,于2020 年 2 月 23 日访问。
8 . 维基百科,Deepfakes,于 2019 年 12 月 3 日访问。
9 . George Dyson,Analogia:超越可编程控制的技术的出现(纽约:Farrar、Straus 和 Giroux,2020 年),184-185。
10 . Jun-Yan Zhu、Taesung Park、Phillip Isola 和 Alexei A. Efros,“Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks”,IEEE 2017 年计算机视觉国际会议 (ICCV),2223–2232。
11 . 伊塔洛·卡尔维诺,《看不见的城市》(纽约:Harcourt Brace,1974 年),96-97。
知识共享许可缩写:CC:知识共享,BY:署名,CC0:无权利保留,NC:非商业,ND:无衍生,SA:相同方式共享。
0.1 由西班牙裔博物馆和图书馆提供。
0.2 维基共享资源,公共领域。
1.1–2, 5–6, 9, 11 作者:Alvy Ray Smith。
1.3 由 Ken Power 提供。
1.4 维基共享资源,公共领域,由 Alvy Ray Smith 修改。
1.7 Claudio Divizia,Shutterstock,1553757458。
1.8 Indiamart,https://www.indiamart.com/proddetail/gi-corrugated-sheet-4450703088.html,图片于 2020 年 2 月 9 日下载。
1.10 维基共享资源,公共领域。
2.1-2、4-7、10-19 由 Alvy Ray Smith 撰写。
2.3 Vladimir Aleksandrovich Kotelnikov,“O Propusknoi Sposobnosti 'Efira' i Provoloki v Elektrosvyazi [关于电气通信中“以太”和电线的传输能力]。” 在Vsesoyuznyi Energeticheskii Komitet。Materialy k I Vsesoyuznomu S'ezdu po Voprosam Tekhnicheskoi Rekonstruktsii Dela Svyazi i Razvitiya Slabotochnoi Promyshlennosti。Po Radiosektsii [全联盟能源委员会。第一次全联盟通信设施技术改造和进展情况代表大会资料低电流行业。在无线电部分]。莫斯科:Upravlenie Svyazi RKKA,1933 年,4。原始俄罗斯论文由 Christopher Bissell 提供。
2.8 Richard F. Lyon,“'像素'的简史”,在 IS&T/SPIE 电子成像研讨会上发表的受邀论文,2006 年 1 月 15 日至 19 日,加利福尼亚州圣何塞,第 5 页(共 16 页)。
2.9(左)感谢 Christopher Bissell、俄罗斯科学院和 Kotelnikov 家族。(右)照片由麻省理工学院博物馆提供。
2.20 在线几个地方——例如,https ://www.moscovery.com/aleksandr-solzhenitsyn/,2020年 3 月 4 日访问。
2.21 俄罗斯总统:活动,http ://en.kremlin.ru/events/president/news/29520/photos ,图片下载于 2020 年 3 月 4 日。感谢克里姆林宫新闻网站。
3.1 经剑桥国王学院图书馆许可。AMT/K/7/8。
3.2 CC BY-NC-ND 3.0 未移植许可证。阿尔维·雷·史密斯(Alvy Ray Smith),2014 年。
3.3–5, 7 阿尔维·雷·史密斯(Alvy Ray Smith)。
3.6 Kolb Brothers 摄,Kolb Brother's Trail Photos 的硝酸盐负片原件,Cline Library Special Collections and Archives,北亚利桑那大学。由玛丽娜惠特曼提供。
4.1(左)摄影:Christopher Riche Evans,ca。1975 年,由他的遗产提供。(右)维基共享资源,照片 © Carolyn Djanogly。
4.2–3 Tom Kilburn,“用于二进制数字计算机的存储系统”,1947 年 12 月 1 日,http://curation.cs.manchester.ac.uk/computer50/www.computer50.org/kgill/mark1 /report1947cover.html,2020 年 2 月 29 日访问,照片 1 和 2。
4.4 由曼彻斯特大学计算机科学系提供。
4.5, 7–9 阿尔维·雷·史密斯。
4.6 CC BY-ND 3.0 未移植许可证。阿尔维·雷·史密斯(Alvy Ray Smith),2017 年。
4.10–13, 16, 21–22 经 The MITRE Corporation 许可使用和转载。©2016。
4.14 图片由加利福尼亚州山景城的计算机历史博物馆提供,博物馆日期为 ca。1949 年,Mac McLaughlin 的礼物,对象 ID:102710661。
4.15 Jan Rajchman/RCA 实验室,由 George Dyson 提供。
4.17 图片来自英国曼彻斯特科学与工业博物馆持有的出版物。
4.18 经 The Camphill Village Trust Limited 许可。
4.19 AS Douglas,由 Martin Campbell-Kelly 提供。
4.20 旋风 1 编程,报告 R-196,麻省理工学院数字计算机实验室,1951 年 6 月 11 日,批准公开发布,案例 06-1104, 55。
4.23(左)经 The MITRE Corporation 许可使用和转载。© 2016。(右)Alvy Ray Smith。
4.24(左)纺织品采样器,维基共享资源,公共领域。(右)意大利拉文纳 St Apollinare Nuovo 大教堂的天使之间的玛丽和耶稣马赛克,作者 wjarek,Adobe 股票,310119847,扩展许可。
4.25(左)麦当娜,作者 Meyer Hill,美联社运营商,马里兰州巴尔的摩,1947 年,由 Alvy Ray Smith 的文字汇编而成。(右)哈马舍尔德,1962,维基共享资源,CC BY 3.0 Unported license,照片由 Jonn Leffmann 拍摄。
4.26-27 理查德·舒普。经卡内基梅隆大学和 Nancy Dickenson Shoup 许可。
5.1 维基共享资源,CC BY-SA 2.5 通用许可,由 Kto288 提供。
5.2 收藏 Cinématheque française,Stephane Dabrowski 摄。由 Laurent Mannoni 提供。
5.3 WKL Dickson 和 Antonia Dickson,Kinetograph、Kinetooscope 和 Kineto-Phonograph 的历史(纽约:WKL Dickson,1895,国会图书馆副本)的封底。
5.4 Athanasius Kircher,Ars Magna Lucis et Umbrae(第 2 版,阿姆斯特丹,1671 年),768。
5.5 © 皮克斯。
5.6(左)维基共享资源,公共领域。(右)国会图书馆,弗朗西斯·本杰明·约翰斯顿摄,约 1890 年。
5.7-9, 15-16, 18 作者:Alvy Ray Smith。
5.10 CC BY–ND 3.0 未移植许可证。阿尔维·雷·史密斯(Alvy Ray Smith),2015 年。
5.11(左)Getty Images,115961049。(右)戈登·亨德里克斯电影历史论文,档案中心,美国国家历史博物馆,史密森学会,AC0369-0000009。
5.12 爱迪生国家公园,公共领域。
5.13 Étienne-Jules Marey,1887 年,公共领域。
5.14 维基百科,比赛削减,合理使用。
5.17 阿尔维·雷·史密斯。图片由纽约理工学院提供。
5.19(左)© Sharon Green/Ultimate Sailing,Windmark Productions Inc.(右)© Doug Gifford,Doug Gifford Photography。
5.20 CC BY-SA-3.0 未移植许可证,由 Judy Martin(未命名)女儿拍摄。
6.1 ClipArt ETC 付费商业许可。
6.2(左)由皮特·彼得森提供。(右)由鲍勃·佩里提供。
6.3–9、12、23–25、28、30、39 作者:Alvy Ray Smith。
6.10 维基共享资源,CC BY-SA 2.0 通用许可。通过马歇尔·阿斯特。
6.11(右)FAVPNG 商业许可。
6.13 CC BY–ND 3.0 未移植许可证。作者:阿尔维·雷·史密斯,2020。
6.14(左)维基共享资源,CC BY 2.0 通用许可。作者:伊藤乔。(右)经 The MITRE Corporation 许可使用和转载。©2016。
6.15 IBM Sage 计算机广告,1960 年,https://www.youtube.com/watch?v= iCCL4INQcFo,大约在 ca。1:00。
6.16 J. Martin Graetz,“太空战争的起源”,Creative Computing 7,第 7 期。8(1981 年 8 月):39(下载 80 个中的 41 个),https://archive.org/details/creativecomputing-1981-08/,2020年 2 月 29 日访问。
6.17 照片由 Abbott Weiss 提供,1964 年。经他许可转载。
6.18 CC0 1.0 通用公共领域专用许可证。作者:Wojciech Mu l a。
6.19 经 Antony Hare PI, 2010 许可,© Antony Hare。
6.20(左)CC BY-SA 3.0 未移植许可证。托马斯·福斯曼摄。(中)CC BY-SA 3.0 未移植许可证。查尔斯01的照片。(右)Pierre E. Bézier,“汽车行业现有系统的示例:Unisurf 系统” ,伦敦皇家学会会刊。系列 A,数学和物理科学321(1971):208,图。2.
6.21 经 Tina Merandon 许可。
6.22 Hanns Peter Bieri 和 Hartmut Prautzsch,“前言”,计算机辅助几何设计16 (1999): 579。
6.26 经戴夫·科尔曼许可。
6.27 经 Michele Bosi 许可, http: //VisualizationLibrary.org。
6.29(左)经 Daniel Pillis 许可。(中)画板,https://www.youtube.com/watch?v= hB3jQKGrJo0,大约帧抓取。2:30。(右)照片由拉里·罗伯茨提供。
6.31 © 阿尔维·雷·史密斯 (Alvy Ray Smith),1973 年。
6.32 Bernhart 和 Fetter,美国专利号 3,519,997。
6.33 Edward E. Zajac,“计算机制作的透视电影作为一种科学和交流工具” ,ACM 7 通讯,第 7 期。3(1964 年 3 月):170,图。2. 经 ACM 许可。
6.34 画板 III,https://www.youtube.com/watch?v= t3ZsiBMnGSg,大约帧抓取。约 1 点 22 分 约 1 点 23 分 2:11,约。2:55。
6.35 Ivan Sutherland,“Sketchpad, A Man-Machine Graphical Communication System”,博士论文,麻省理工学院,EE Dept.,Cambridge,MA,1963 年 1 月,133,图。9.8,经 Ivan Sutherland 许可。
6.36 © Ken Knowlton,1998,Laurie M. Young 收藏。http://knowltonmosaics.com/。
6.37 © Cybernetic Serendipity,1968 年,由 Franciszka Themerson 设计。经 Jasia Reichardt 许可。
6.38 Ephraim Cohen 使用由 Ron Baecker 在 Eric Martin 和 Lynn Smith 的建议下设计和编程的Genesys系统制作的动画。经贝克尔和科恩许可。
6.40 Ivan Sutherland,“头戴式三维显示器” ,1968 年 AFIPS 秋季联合计算机会议论文集,759,图。2,经 Ivan Sutherland、Bob Sproull 和 Quintin Foster 许可。
7.1 GE,计算机图像生成,模拟和控制系统部,通用电气公司,佛罗里达州代托纳比奇,NASA 图像,公共领域。由吉姆·布林供稿。
7.2 NASA/JPL–Caltech/Dan Goods,公共领域。
7. 3 NASA 图片,公共领域。罗纳德·帕内塔供稿。
7. 4 NASA 图片,公共领域。由 Peter Kamnitzer 和 Gene Youngblood 提供。
7.5–11, 14–17, 19, 28–29 作者:Alvy Ray Smith。
7.12 CC BY–ND 3.0 未移植许可证许可证。作者:阿尔维·雷·史密斯,2019。
7.13(左)Edwin Catmull,“计算机生成电影系统” ,ACM 年会论文集,卷。1, 426,波士顿,马萨诸塞州,1972 年 8 月 1 日。另外https://www.youtube.com/watch?v=RBBcPeZ1rgk&feature=youtu.be 1:30。经许可埃德卡特穆尔。(中)Frederic Ira Parke,“人脸的计算机生成动画”,硕士论文,犹他大学,1972 年 6 月,17,图。2.8(d)。还有 Frederic Ira Parke,“计算机生成的人脸动画” ,ACM 年会论文集,第一卷。1, 453,波士顿,马萨诸塞州,1972 年 8 月 1 日。经 Fred Parke 许可。(右)康奈尔透视,https://www.youtube.com/watch?v= 3iQqqv_bcXs,framegrab ca。0:07。经唐格林伯格许可。
7.18 Luká š Buri č in. Wikimedia Commons,公共领域。
7.20 理查德·舒普。经卡内基梅隆大学和 Nancy Dickenson Shoup 许可。
7.21 Preston Blair,动画(Walter T. Foster,ca. 1940s),http://www.welcometopixelton.com/downloads/Animation%20by%20Preston%20Blair.pdf,2020年 3 月 1 日下载,封面,22, 24。由普雷斯顿布莱尔庄园提供。
7.22–23, 26–27, 33 经纽约理工学院许可。
7.24 Wikimedia Commons,公共领域,由 Viscountrapier 提供。
7.25 Ephraim Cohen,1977 年,经他许可。
7.30 维基共享资源,CC BY-SA 3.0 未移植许可证。作者:Brion Vibber、McLoaf 和 GDallimore。
7.31 由 Jim Blinn 提供并经其许可。
7.32(左)经纽约理工学院许可。(右)太阳石,1979 年,由 Ed Emshwiller 执导,由 Alvy Ray Smith 制作纹理映射动画。
8.1 阿尔维·雷·史密斯。图片由皮克斯动画工作室提供。
8.2 MC Escher,带反射球的手,1935 年。 ©2020 MC Escher 公司—荷兰。版权所有。
8.3 Turner Whitted,“一种改进的阴影显示照明模型” ,ACM 23通讯,第 6(1980 年 6 月):347,图。7. 经 ACM 和 Turner Whitted 许可。
8.4 Gilles Tran,眼镜,2006 年。经 Gilles Tran 许可。
8.5 JI Yellott Jr.,“恒河猴视网膜中光感受器采样的光谱后果”,Science 221(1983 年 7 月 22 日):383,图。1(B 2 )。经 AAAS 许可。
8.6 阿尔维·雷·史密斯。
8.7 概念和图片由 Thomas Porter 提供。©皮克斯。
8.8 阿尔维·雷·史密斯。概念由皮克斯的 Thomas Porter 提供。
8.9 托马斯·波特,1984 年,1984 年。© 皮克斯。
8.10 阿尔维·雷·史密斯。图片由皮克斯动画工作室提供。
8.11 Alvy Ray Smith 的作曲,Loren Carpenter、Tom Duff、Chris Evans 和 Thomas Porter 的组件。图片由皮克斯动画工作室提供。
8.12 Tron (1982), https://www.youtube.com/watch?v=-BZxGhNdz1k , framegrab ca。0:29。
8.13(左)照片经 Ed Catmull、Alvy Ray Smith 和 Loren Carpenter 许可使用。图片由皮克斯动画工作室提供。(右)Craig Reynolds 的概念,Alvy Ray Smith 的图形。
8.14 © 皮克斯。
8.15 约翰·拉塞特。图片由皮克斯动画工作室提供。
8.16 WR Purcell Jr.,了解公司财务:图形方法(旧金山:Barnes & Noble Books,1983 年)和 Richard I. Levin,低买高卖,早收晚付:财务生存经理指南(旧金山:Prentice Hall,1983 年),Alvy Ray Smith 收藏。
9.1 图片由 Alvy Ray Smith 拍摄。
9.2 活力带–L2–205552D2eC2,© Darcy Gerbarg,2018。
9.3–4 Jun-Yan Zhu、Taesung Park、Phillip Isola 和 Alexei A. Efros,“Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks”,IEEE 2017 年计算机视觉国际会议,意大利威尼斯,无花果。1 和 12,经作者许可。
页码后跟“f”表示数字。
在第一圈,67
科捷利尼科夫和,67
与 Beria 一起领导 NKVD,62
领导 SMERSH,62
斯大林和62
学术奖
技术(科技), 301 , 368 , 409 , 427 , 460
王牌(电脑),132
高级研究计划署。见 ARPA
飞机模拟器。见飞行模拟器
阿罕布拉,25
几乎计算机, 100 , 103 , 108 , 120 , 121 , 133 , 136
Alpha (A) 通道,385
Altamira Software 和428–429
增强现实 (AR) 和458
Ed Catmull, Alvy Ray Smith, 和, 363–365 , 367–368
概述,363–368
汤姆·波特、汤姆·达夫和368
RGBA绘画程序和,385
阿尔塔米拉作曲家,368
扩增, 19 , 77 , 119–120 , 247 , 434 , 441
去超新星,301-304(另见摩尔定律:超新星)
摩尔定律和, 82 , 120 , 301–304 , 310 , 338 , 435 , 455 , 463
81-82的概述和性质
超越和,81-83
三角形和, 243–246 , 307 , 322 , 329 , 337 , 386–387 , 387f
Amtorg 贸易公司,64–65
作为间谍活动的温床,65
模拟(与数字),2
模拟和数字无穷大, 48–51 , 48f–51f , 55 , 59 , 68 , 74
将模拟媒体类型融合到数字/通用媒体中,436
模拟(与数字)(续)
傅立叶和, 4 , 15 , 50 , 51 , 74 , 438
大数字融合,436
模拟的现实,328
采样定理和, 44 , 49 , 50–51 , 59 , 64 , 74
模拟动画机,349
模拟时钟,15
样品,49
André & Wally B. (电影), 412–416 , 418
动画技术
cels(见cel 动画)
剪纸, 211
刀耕火种,211
抗锯齿, 162f , 377 , 399 , 403 , 411
水平, 161
概述和性质, 161–162
光栅图像,359
采样定理和,161-163
预期和夸张, 171 , 213 , 216–217 , 450
阿波罗月球计划,309f , 320 , 321 , 339 , 455
阿波罗-联盟号测试项目,71
近似理论,275
增强现实。见 增强现实
ARPA (高级研究计划署),314、454、455 。另见DARPA
道格·恩格尔巴特和,256
创始, 254
资助计算机图形学,293–294
NASA和254、307、314、454、455 _ _ _ _ _ _ _
拉里·罗伯茨和,294
伊万·萨瑟兰和, 294 , 296 , 355 , 454
鲍勃·泰勒和,294
艺术,167、209、210、297–299、327、350、351、375、376、454。_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 另见 DiFrancesco,大卫
Ed Emshwiller 和,375–377
NEA 和355–356
光栅图形获得了它的第一笔公共艺术资金,355–356
Jasia Reichardt 和(参见Cybernetic Serendipity)
阿尔维·雷·史密斯 (Alvy Ray Smith),344
技术,355
电传打字机,161
斯坦范德贝克和,355
人工制品,取样。请参阅 采样工件
第三定律,463
原子弹(A - bomb),73、254、256、451
混合现实 (MR) 和459–460
头像,461–462
宝贝(电脑)。见 曼彻斯特宝贝
Baecker, Ronald Michael (“Ron”), 262 , 298–299 , 301 , 348 , 372
Genesys和299、301、348、371 _ _ _ _ _
TX - 2和298、299、371 _
烘焙,462
在米奇(克拉夫顿)之前,206、209、210、224、225 _ _
克劳德·香农 (Claude Shannon),45 岁、75岁、104岁
在第一圈,67
领导内务人民委员部,62
贝塞尔,皮埃尔·E。
Paul de Faget de Casteljau 和,270–271
罗宾福雷斯特和,275
数学和, 275
概述,267–269
照片,270f
作为战俘 (POW), 268
贝塞尔曲线, 261 , 267 , 271 , 272 , 274
贝塞尔补丁,267 , 271 , 274–275 , 343
贝塞尔样条曲线,274
双三次吊具,57–58
比林斯利,弗雷德,52 岁
传记,202–203
位
计算机说话和数数,69
关于的误解,111
不需要计算,114
术语,122
布兰查德,马尔科姆,353、355、374、403 _ _
布莱切利公园, 92 , 102f , 103 , 111–113
炸弹由102
马克斯·纽曼( Max Newman )在103、104、113
概述,101–102
图灵, 78 , 80 , 92 , 101–104 , 111 , 113
Blinn , James F.(“吉姆”),304、331、369、383
描述和概述,369
大卫 Em 和,349–350
喷气推进实验室( JPL )和350、370、383、403、404 _ _
在卢卡斯影业,403
在纽约理工大学,331、369、370、403 _ _
阿尔维·雷·史密斯( Alvy Ray Smith )和369、370、383、403、404
布林定律,419
卡尔路德维希和,375
MAGI 和373 , 375 , 407 , 431 , 432 , 456
波拿巴,拿破仑。见 拿破仑·波拿巴
布雷斯韦尔,罗恩,42 岁
布雷森汉姆,杰克,247、248、262 _
B样条,272
布尔加科夫,米哈伊尔,47岁
布什,万尼瓦,253–254
名片设备, 89–90 , 90f , 92 , 95 , 111 , 119
作为计算机,93、105、106、110、119、137 _ _ _ _ _ _ _ _
编码,108
(名片的)方向/状态,92、94、105、110、441 _
加元。参见 计算机辅助设计
计算器,111
书法绕道, 139–141 , 163 , 241 , 277
卡尔维诺,意大利,467
无相机电影,461–462
相机投影系统,200-201。又见电影摄影
CAPS (电脑动画制作系统), 219 , 223 , 296 , 411 , 424 , 450
Carpenter, Loren, 386 , 403–405 , 409 , 415 , 425 , 427。又见无产阶级
喷气推进实验室( JPL )和386、403、404
卢卡斯影业和399 , 403 , 411 , 425 , 427
阿尔维·雷·史密斯( Alvy Ray Smith )和386、387、401、411、411f
卡彭蒂埃,朱尔斯,200
漫画方法,295
阴极射线,138
埃德萨克和,144
电磁偏转器,318
NASA-1 和318
概述和性质, 138–139
存储位,149–150
弗雷迪威廉姆斯和,121
Catmull, Edwin (“Ed”), 351 , 355 , 364 , 365 , 367 , 386 , 409 , 410 , 413 , 414
动画和, 219 , 233 , 334 , 354 , 355 , 359 , 399 , 410 , 413
在应用程序,355
克里斯汀巴顿和,357
马尔科姆布兰查德和,355
大写字母和219
深度缓冲和,336
大卫·迪弗朗西斯科和, 374 , 383 , 384 , 402 , 409 , 417
在数字等价物上,339
219 , 354 , 355 , 368 , 369 , 374 , 383 , 402 , 409 , 419–421 , 423的就业和职位
家庭, 355
卢卡斯影业和, 219 , 355 , 374 , 382–384 , 399 , 402 , 409 , 411 , 413 , 419–423
运动模糊和,399
纽约理工大学和355、357、368、371、372、377、382、383、402、409、417 _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _
概述,354–355
皮克斯和, 219 , 240 , 355 , 374 , 421 , 429 , 431 , 433 , 460
编程语言,372
鲍勃舒马克和,357
亚历克斯·舒尔和219、354、355、378、379、402 _ _ _ _ _ _
阿尔维·雷·史密斯和, 219 , 223 , 240 , 284 , 351 , 353 , 354 , 363–365 , 369 , 374 , 378–379 , 382–384 , 409 , 410 , 413 , 417–423 , 428 , 46
补间程序和417
犹他大学261 , 317 , 334 , 354 , 357 , 369 , 371 , 410
华特迪士尼公司和219 , 223 , 378–379 , 413 , 428 , 429
Catmull-Rom 样条,240
塞尔动画。另请 参阅
Ed Catmull 和,359
经典,185
墨水和油漆,212–213
Ub Iwerks 和, 212
皮克斯和,450
cels(赛璐珞片),211-213,301,418 。另见cel 动画
数量限制,213
中心教条,7
威廉·费特和,281
逆向计算机图形和,459
摩尔定律和,329
牛顿物理学和, 7 , 327 , 418 , 457 , 459
外面, 279 , 328 , 343 , 355 , 457
概述,457
千禧年后的使用,458–460
CAD 和混合现实 (MR )中需要,279、327、459
破译象形文字,28
Champollion-Figeac,雅克-约瑟夫,40
角色动画, 205 , 210 , 348 , 407 , 408 , 412 , 413 , 456
中心教条和,418
第一,209
210–211的技术
角色动画师, 408 , 412 , 414 , 417 , 418
温莎·麦凯作为第一个,209
切尔托克,鲍里斯
俄罗斯火箭科学家,68 岁
沙拉什卡,68 岁
计时码表,202–203
计时摄影师,198
庄,理查德,409–411
“电影。” 另请参阅 电影
术语的使用,176
电影摄影师,200–203
克拉克,詹姆斯 H.(“吉姆”),377
搅动马蜂窝,377–378
克拉克,韦斯利 A.,284
克拉克,亚瑟 C.,304
克劳德·E·香农奖,53
彩色像素,311
首先, 316 , 318 , 320–322 , 432 , 455
通用电气和316、320、321、323、330 _ _ _ _ _ _
Rougelot 和 Schumacker 以及, 331 , 344 , 357
喷气推进实验室 (JPL) 和314–316
罗德·鲁杰洛特和321 , 331 , 344 , 357 , 455
巨像, 103 , 111 , 121 , 133 , 447
计算
确定但未预先确定, 81 , 106 , 107 , 441
历史,4
延展性和, 77 , 81 , 83 , 114 , 119 , 390 , 440
谜底,5
不需要的速度、位和电子设备,114
计算机辅助设计 (CAD), 252 , 265 , 271 , 443 , 453 , 457
车身模拟,422
皮埃尔·艾蒂安·贝塞尔和, 267 , 269 , 271 , 279
史蒂文·安森·库恩斯和, 263 , 264 , 279 , 285
Paul de Casteljau 和, 279 , 453
罗宾福雷斯特和,265
巴雷特哈格里夫斯和,286
计算机辅助设计 (CAD)(续)
概述和性质,249
面向图片的计算机图形学和, 249 , 252 , 263 , 279 , 285 , 291 , 443 , 453
开拓者,453
伺服实验室和,253
画板 I、画板 III 和290
玩具总动员和,252
麻省理工学院的计算机辅助设计 (CAD) 项目,253
电脑动画制作系统 (CAPS), 219 , 223 , 296 , 411 , 424 , 450
出生, 281
定义和概述,240–242
数码灯和,240
第一次使用该术语,281–282
240–241所需的步骤
计算机图形和图像处理(期刊),262
电脑)。另请参阅特定主题
不是数字计算者,111
第一台(见 第一台电脑)
历史,6
的发明,4
放大的奇迹,4
关于109–112的神话
计算机语言,69
征服,罗伯特,61 岁
建筑与重建,453
Cook, Robert L. (“Rob”), 427
卢卡斯影业和, 331 , 388 , 399 , 425 , 427
塑料和,388
库恩斯,史蒂文·安森(“史蒂夫”),453
皮埃尔·贝塞尔和, 261 , 263 , 267 , 269
计算机辅助设计( CAD )和263、264、279、285 _
伊万·萨瑟兰和, 263 , 265 , 269 , 276 , 284 , 285
昆斯奖, 261 , 267 , 269 , 394 , 427
Coons 补丁,264–267 , 271 , 275 , 290
科波拉,弗朗西斯·福特,410
康奈尔 1972 年的电影, 334 , 335 , 374
罗伯·库克 (Rob Cook),388
通用电气和321、330、331 _ _
唐·格林伯格,电话:321、331、334、374、388 _ _ _
马克·莱沃伊 (Marc Levoy),374
MAGI 和,374
罗德·鲁杰洛 (Rod Rougelot),电话: 320–321 , 331 , 334
傅里叶波 和, 30 , 32 , 176 , 177 , 179
表弟,维克多,35 岁
计算机图形学和241–242
显示空间和, 63 , 64 , 240–242 , 263 , 346–347 , 369
绘画程序和347
创造力,品种/种类,460-462。另请参阅 Tower vs. stinks
科学家与工程师,8
技术来自于8
古巴,拉里,381–382
Cybernetic Serendipity: The Computer and the Arts (Reichardt), 296–298 , 298f , 355 , 371 , 454
DAC-1。参见 计算机增强的设计
大卫, 雅克-路易, 2 , 3f , 8 , 13 , 435
去老化, 462
de Casteljau, Paul de Faget, 279 , 453 , 454
概述,270–271
照片,271f
de Casteljau 曲线, 271–272 , 274
剪纸,211
深度伪造,462
Demenÿ, Georges, 199 , 203 , 450
Demenÿ-Gaumont 关系,202–203
Demenÿ–Yanks 关系,204
亨利乔利和,203
Marey-Demenÿ 关系, 198 , 199 , 201–202
德尼罗,罗伯特,462
深度缓冲区,336
计算机增强设计 (DAC-1)
创建, 285
麻省理工学院,286
迪克森,安东尼娅(威廉的妹妹),193
迪克森,威廉·肯尼迪·劳瑞(“WKL”/“劳瑞”),196
信用(不)给予193–197 , 201 , 449 , 451
爱迪生和,190–199
家庭背景和早年生活,194
电影, 207
Lumière 兄弟和,452
作为真正制作电影的人,193–197
名字,193–194
个性, 194
投影机和, 192 , 195 , 196 , 204 , 451
克里斯汀巴顿和,357
Ed Catmull和374、383、384、402、409、417 _ _ _ _ _ _ _ _
电影录音机项目,384
基于激光的胶片扫描仪和384
MAGI 和,375
国家艺术基金会 (NEA) 赠款和348–350 , 355 , 356
纽约理工大学和355、375、379、383、402 _ _ _ _ _
概述,348–350
PARC和349、350、355、356 _ _ _ _ _
迪克舒普和,349
阿尔维·雷·史密斯和348 , 350 , 351 , 353 , 355 , 356 , 358 , 358f , 374 , 375 , 379 , 383 , 402 , 409 , 417
数字的
历史,2
数字文物。请参阅 采样工件
阐明惠特尼王朝的贡献,318-320
(第一) 的黎明, 118 , 119 , 119f , 121–122 , 252
126–127、128f、130的流程图_
定义,2
大数字融合和, 44 , 63 , 148 , 163 , 205 , 310 , 373 , 376 , 435–436
数码灯体验,种类繁多
计算机图形学, 443
图像处理,443
交互式与非交互式,443–445
对象与图片,443
面向图片的计算机图形学,443
实时与非实时,443–445
数字电影,6-7
首先(见 电影,The)
工作室(见蓝天;梦工厂;皮克斯)
数码照片。又见 第一道光
轻浮或禁止, 2 , 119 , 125 , 256 , 318 , 452
数字制作,409–412
Dirichlet,彼得·古斯塔夫·勒琼,42 岁
迪士尼(华特迪士尼公司),219、223、456 。另见大写字母
Ub Iwerks 和, 172 , 212 , 219–225 , 379 , 450
迪士尼,罗伊·爱德华(沃尔特的侄子),223 , 430 , 433
迪斯尼,罗伊奥利弗(沃尔特的兄弟),220 , 221 , 223
米老鼠和, 166 , 221–222 , 286 , 452
展示
作为从样本中重建模拟的行为,63
作为现代世界的基本假设,63
是可变的,而像素是恒定的,63
从435–436中分离图片
启用大数字融合,436
声音是扬声器和放大器,63
显示元素。另请参阅 传播像素
数字输入,模拟输出,2
作为非通用且因设备而异,436
平滑连续,2
作为微小的发光点,2 , 5 , 64 , 139 , 436
可见, 436
展示空间,241–242
在增强现实 (AR) 中,459–460
创意空间和, 63 , 64 , 240–242 , 263 , 346–347 , 369
绘画程序和346–347
像素和, 63 , 64 , 241 , 246 , 347 , 369
书法,连续,139 , 163 , 241 , 246–247 , 257 , 277–278 , 277f , 318 , 381
理查德·德莱福斯,460–462
Droidmaker: George Lucas and the Digital Revolution (鲁宾), 374 , 415
达德利,荷马 W.,67 岁
达夫,汤姆,372–373、404、406 _
Alpha 通道和368
DVD, 4
戴森,乔治,463
巴黎综合理工学院,22
皇家军事学院,13
爱迪生,托马斯
声称他人的发明为自己的,451
WKL 迪克森和, 190–199
投影仪和, 192 , 195–197 , 204 , 451
爱德华·迈布里奇和, 165 , 192 , 193 , 450
Edvac 报告(Edvac 报告初稿), 127 , 130–132 , 134
爱德华兹,大卫“戴”,125
鸡蛋厂(卢卡斯影业),383
埃及。另见 罗塞塔石碑
描述 de l'Egypte , 22
埃及学,28
拿破仑的学者,22
埃及学,22
帮助赫伯弗里曼逃离纳粹德国,261–262 , 344 , 454
Em,大卫,349–350
发射光与反射光,33
Emshwiller, Ed (“Emsh”), 375–377
加密。见 一次性垫
恩格尔巴特,道格,255–256,293–294
作为“几乎是计算机”,100 , 103 , 108 , 120 , 136
出生, 120
巨像和,121
数码灯和,100
Eniac+ (Eniac 的可编程版本), 136 , 137 , 396 , 448
出生, 136
作为第一台计算机,136、396、448
Entscheidungs 问题。见 问题
Epoch 1(计算机历史),120,310 。另见 摩尔定律
概述,7
阶段,248
纪元 2(计算机历史),7,82。另见摩尔定律;摩尔定律加速
约会和开始, 120 , 249 , 302 , 302f , 310 , 321 , 322
时代 2 放大。见 放大
电子问题(Entscheidungsproblem),85-89
Alonzo Church 的解决方案,88-89
以太网,294
欧多克希亚,467
欧拉,莱昂哈德,46 岁
埃文斯,大卫,261、278、294、296、354 _ _ _ _ _
Ivan Sutherland 和, 261 , 278 , 294 , 296 , 454(另见Evans & Sutherland)
埃文斯和萨瑟兰 (E&S), 330 , 331 , 351 , 358
克里斯汀巴顿和,357
港口模拟器,356
LDS-1(书法展示),278
Rougelot 和 Schumacker 在321 , 357
亚历克斯舒尔和,353–355
约翰沃诺克和,357
埃弗里特,鲍勃,145 岁
夸张,214
预期和, 171 , 213 , 216–217 , 450
扩大电影院,355
扩展影院(Youngblood), 313–314 , 316 , 318–320 , 355 , 455
扩展现实 (XR), 460
信仰与科学,227
范,莫琳,458
农场, 169
菲利克斯猫,224–225,224f
中心教条和,281
计算机图形学,281–282
透视和, 281–284
电影。看 电影
电影帧。见框架
定义, 447
第一部数字电影。看 电影,
关于 Edvac 的报告初稿。见 Edvac 报告
First Light(第一张数码照片),119、158、159、243、252、452。_ _ 另见数码灯
宝贝和, 125 , 163 , 256 , 319 , 448
汤姆·基尔本和118、119f、122、125、158、448 _ _ _ _
弗莱舍、戴夫和马克斯,218–220
电影和早期电影系统的诞生,187 , 188–189f , 190 , 194–196 , 198 , 201 , 204 , 205
早期计算机图形学 (Epoch 1), 248–249 , 250–251f
福雷斯特,罗宾,265、269、275、297 _ _ _
关于动画,158
概述,262–263
数字光的基本思想。另见 采样定理
采样定理,5
图灵的计算,5
傅立叶,让·巴蒂斯特·约瑟夫,4、7-8、11、437、445 _
模拟图片表示和,438
1768 年12月出生于欧塞尔
与14 岁的罗伯斯庇尔发生冲突
橱柜, 13
为奥尔良的三名公民辩护,14
排干 Bourgoin 的沼泽,34
编辑描述 de l'Egypte , 34
埃菲尔铁塔,姓名,39
羡慕牛顿,13
颂扬克莱伯,23
流放到格勒诺布尔,23
全名让·巴蒂斯特·约瑟夫·傅立叶,13 岁
玛丽苏菲热尔曼和,38-39
39岁的法兰西学院不朽者
1794 年入狱,14
加入欧塞尔大众社会,14
生活史和概述,12-15
渴望永生,12-15
数学家和实验者,12
导师商博良,28 岁
作为罗纳省省长,38
获奖论文,36-37
傅立叶波
角度,30
一个展开的圆圈(一维),15
颜色, 32–33
波纹(二维),30
波纹和, 30 , 32 , 176 , 177 , 179
循环,17
展开的圆柱体(二维),30
是一个正弦波,16
30-32 岁的东西
扩增和386–387、387f、414 _
Loren Carpenter 和, 386 , 387 , 404 , 411
帧缓冲区,348,350–351,355,362,403 _ _ _ _ _ _
Alpha通道和365、367、384–385 _ _
克里斯汀·巴顿 (Christine Barton) 连接了356–358
深度缓冲区、三角形和336
数码灯和,316
在卢卡斯影业,384–385
JPL 使用的机械帧缓冲区,314–315
性质, 314
像素和314–316 , 325 , 336 , 343 , 345 , 347 , 357 , 363–365
亚历克斯舒尔和,351,363,364,374 _ _ _
SuperPaint 和343–348
帧率,182
相框,胶卷,182–183
作为时间样本,444
弗里曼,赫伯特(“赫伯”)
共同创办计算机图形和图像处理(期刊),262
在爱因斯坦的帮助下逃离纳粹德国,261–262 , 344 , 454
阿尔维·雷·史密斯 (Alvy Ray Smith) 和, 261 , 344
国王路易十六被斩首,14 岁
欧塞尔大众社会,14
15岁的罗伯斯庇尔被斩首
频率峰值, 24 , 27 , 34 , 179 , 187
带宽,30
象形文字和,30
高频和, 24 , 33 , 72 , 158 , 214 , 324
性质, 30
锋利的边缘意味着高频,72
通用电气 (GE)
和第一个颜色像素,316 , 320 , 321 , 323 , 330
为 NASA 制造的飞行模拟器,314 , 316 , 319 , 320
罗德·鲁热洛( Rod Rougelot) ,电话:321、322、331、334
Rougelot 和 Schumacker 在357 , 455
鲍勃·舒马克( Bob Schumacker ) ,电话:318、321、322、331、357、455 _
DAC - 1和285–286、289、454 _
华特迪士尼和286
麻省理工学院,286
创世纪效应,404
天才,天性,42
Gentilella, John (“Johnny Gent”), 219
几何模型和扩展像素,241 , 242 , 245 , 246 , 256
Gerbarg, Darcy, 458–459 , 459f
金茨堡,维塔利,73
护目镜,立体/智能,260 , 458。另见 头戴式显示器;体视
戈卢布佐娃,瓦莱里亚
62岁成为MEI的长期董事
作为 MEI 的优秀学生,62 岁
作为 MEI 的董事,65 岁
她的革命血统来自列宁,62
Golubtsova, Valeriya (续)
母亲(奥尔加·内夫佐洛娃),62 岁
保护 Kotelnikov 免受 NKVD 的伤害,65–66
以67-68第二次救下科捷利尼科夫
图形用户界面,289、293、294 _
第一,255–256
重力,12
大数字融合, 4 , 12 , 43 , 44 , 72 , 75 , 374
放大和,120
动画和, 205
阴极射线管 (CRT) 和138
定义,2
数码灯和, 44 , 63 , 148 , 163 , 205 , 310 , 373 , 376 , 435–436
437的意思
摩尔定律和,456
电影和, 4 , 310 , 328 , 406 , 429 , 432 , 456
像素和2 , 63 , 141 , 241 , 313 , 376 , 436
光栅显示和, 277
需要全局存在的显示器,63
大恐怖/大清洗,79
及其暴君,61–62
Greenberg, Donald P.(“唐”),334、374、388
在康奈尔大学,320–321 , 331 , 334 , 374
Rod Rougelot 和, 320–321 , 331 , 334 , 374 , 455
古根海姆, 拉尔夫, 375 , 381–382 , 433
在纽约理工大学,374、381、382、433 _ _
由 Beria 和 Abakumov 经营的奴隶劳改营,62
黑客、太空战争和第一次,257–259
锤子,阿尔芒,65 岁
哈格里夫斯,巴雷特,286
头戴式显示器,305、334、377、457。_ _ _ _ 另见护目镜;体视
亨德里克斯,戈登,190
Herzog, Bertram (“伯特”), 267 , 331 , 454
隐藏面问题,364
高清电视 (HDTV), 4
希尔伯特的第二个问题,98
史学。另见 流程图;理念-混乱-暴君
圣徒传记,2
全息镜头,460
百日,37-39
氢弹(H - bomb),72、73、254、256、451 _ _
IBM 701、135、137、142、157–158 _ _ _ _ _ _
IBM 702、157、158 _ _
冰河世纪(电影), 331 , 407 , 431 , 456
理念-混沌-暴君,三合会,7 , 432–433 , 445 , 452 , 454 , 456–457 , 463。又见 暴君
在计算机中,451
数字电影,456–457
在电影中,451–452
形状, 454
图灵,79-80,120-121,446-447 _ _ _
理想电影, 176–177 , 179–180 , 186 , 187 , 450
理想的电影重建,180-182
图像处理,443
图像处理程序,241
无穷大,种类,48
Information International Inc.见 Triple-I
信息论,53
交互式渲染的计算机图形
画板作为第一(2D),287
画板 III 作为第一个 3D,454
互联网,
以太网和294
看不见的城市(卡尔维诺),467
欧文,林恩,113–114
艾沃克斯,Ub,219–221
动画和, 172 , 212 , 219–221 , 450
作为商人,166
罗伊迪斯尼和,223
华特迪士尼和172、212、219–225、379、450 _ _ _ _ _ _
财务,219–222
米老鼠和221–222
迈布里奇栅格和172
名字,220
声誉和遗产,223
威利汽船,225
艾沃克斯工作室,222
喷气推进实验室 (JPL), 52 , 350 , 370 , 383 , 386 , 404
吉姆·布林和350、370、383、403、404 _ _ _ _ _
Loren Carpenter 和, 386 , 403 , 404
彩色像素和314–316
314–315使用的机械帧缓冲区
NASA 参与314
乔布斯,史蒂夫,191
迪士尼和428
与爱迪生相比,191
财务, 191 , 423 , 425 , 429 , 433 , 456–457
乔纳森·艾夫和,191
杰弗里·卡岑伯格和,428
皮克斯和, 423 , 425 , 429 , 433 , 456–457
约翰逊,蒂莫西·爱德华(“蒂姆”)
建筑生涯,291
Coons 补丁和290
从长远来看,290
画板 III 和, 275–276 , 279 , 290–292 , 454 , 457
Larry Roberts and, 276 , 279 , 281 , 284 , 290–292(另见 Triumvirate)
Ivan Sutherland 和, 263 , 275 , 285 , 289–291 , 294(另见 Triumvirate)
Triumvirate 和276、276f、285、454(另见 Triumvirate)
约翰逊航天中心。见 载人航天器中心
“欢乐事件”,第203 页
Kajiya, James T.(“吉姆”),305 , 351
卡岑伯格,杰弗里,428
关键帧动画,301
关键帧, 299 , 301 , 359 , 361 , 362
基尔本,汤姆,117、133、150 。另见威廉姆斯管/Williams-Kilburn 管
宝贝和, 118 , 122 , 124f , 125 , 126 , 133 , 134 , 447 , 448
位/位和,122
计算机内存和122
显示与图片元素和,122
论文,134
Edvac 报告,134
First Light(第一张数码照片)由118 , 119f , 122 , 125 , 158 , 448创建
对计算机设计的影响,127
采样定理和,158
冯诺依曼架构和,134
弗雷迪·威廉姆斯和, 117 , 118 , 122 , 126 , 127 , 132–134 , 141 , 447
动画机,192
电影放映机, 192 , 195–197 , 200 , 203
国王学院, 剑桥, 77 , 78f , 79 , 134 , 463–464
克勒贝尔,让·巴蒂斯特,23 岁
诺尔顿,肯,296–298
亚历山大·科捷利尼科夫(弗拉基米尔的父亲)
举家到基辅,46
47岁举家迁往莫斯科
作为喀山大学数学家,46
彼得·科捷尔尼科夫(弗拉基米尔的祖父)
作为罗巴切夫斯基的助手和冠军,46 岁
作为喀山大学数学家,46
Kotelnikov, Semyon(弗拉基米尔的曾曾曾祖父)
圣彼得堡科学院,46
作为欧拉的学生,46 岁
科捷尔尼科夫,弗拉基米尔·亚历山德罗维奇,5岁,45 岁,73-75岁
1932 年47岁
1908年出生于喀山,46岁
对太空竞赛的贡献,68
MEI 院长,47岁
死亡,76
作为 NKS 的工程师,48岁
71岁的阿波罗-联盟号的俄罗斯一侧
NKS的领导学院,48
听到他的第一次广播,47
IEEE Alexander Graham Bell 奖章授予43
MEI 讲师,47岁
列宁奖,71
作为 MEI 的首批毕业生之一,47
预测手机,71
保护者(见 Golubtsova,Valeriya)
萨哈罗夫事件和,72
由54证明的采样定理
再次被戈卢布佐娃扑出,67-68
Golubtsova 从 NKVD 中救出,65–66
第二次尝试让他进入 sharashka, 68
第二次访问美国,71
斯大林奖和列宁勋章,43
访问美国 Amtorg,64
作为声码器专家,67
科捷利尼科夫的暴君。见 阿巴库莫夫,维克多;贝利亚,拉夫伦蒂;马林科夫,乔治
克日扎诺夫斯基,格莱布
作为列宁的朋友,62 岁
与62 岁的 Zinaida Nevzorova 结婚
忽必烈,467
拉塞特,约翰,401,412–413,415 _
迪斯尼和, 226 , 407 , 408 , 413 , 428 , 430 , 431
杰弗里·卡岑伯格和,428
电影/玩具总动员和, 407 , 412–414 , 421 , 424 , 425 , 428
皮克斯和, 226 , 407 , 413 , 421 , 424 , 425 , 433
比尔·里夫斯和416、421、424、425、428 _ _ _ _ _
阿尔维·雷·史密斯和, 226 , 412–414 , 428
LDS-1(书法展示),278
列宁
布尔什维克财政,62
流亡西伯利亚,62
作为喀山大学的学生,46 岁
Licklider, JCR (“舔”), 255 , 293–294
林肯实验室(麻省理工学院林肯实验室),276,284。另见TX-2
尼古拉·洛巴切夫斯基
爱因斯坦使用的数学,46
非欧几何,46
作为喀山大学数学家,46
卢卡斯,乔治,403、405、406、415 _ _ _
André & Wally B. and, 415
动画和, 413
Ed Catmull 和, 383 , 413 , 419 , 421
迪士尼和413
拉尔夫·古根海姆、鲍勃·金迪和381–382
项目, 381
抵制制作电脑动画电影,416
阿尔维·雷·史密斯和382 , 403 , 405 , 406 , 415 , 419
星球大战和381
卢卡斯,玛西娅(乔治的妻子)
Lucasfilm Ltd.另见星球大战
和“几乎”制作电影,416
布拉德伯德的访问,412
Loren Carpenter 和, 399 , 403 , 411 , 425 , 427
Ed Catmull 和, 219 , 355 , 374 , 382–384 , 399 , 402 , 409 , 411 , 413 , 419–423
cel动画和,219
计算机图形学明星,403
罗伯·库克和331、388、399、425、427 _ _ _ _ _
在385设计数码光学打印机
迪士尼和219
汤姆·达夫和368、374、402、403 _ _ _
财务,421–423
帧缓冲区,384–385
拉尔夫古根海姆和, 374 , 381 , 382 , 433
硬件, 426
约翰·拉塞特和,412–413
摩尔定律和,456
纽约理工大学和330、331、355、373–374、402、433 _ _ _ _ _ _ _
卢卡斯影业的 NYIT 秘密之旅,381–384
皮克斯和, 219 , 330 , 373–374 , 416 , 423 , 425 , 427 , 429 , 456
卢卡斯影业诞生皮克斯,419–423
卢卡斯影业有限公司(续)
汤姆波特和, 231 , 241 , 368 , 385 , 399 , 403
RenderMan、Reyes 和425–427
RGBA 绘画程序,385
Alvy Ray Smith 和, 219 , 355 , 373–374 , 382–386 , 388 , 401–403 , 409 , 413 , 416 , 419–423
犹他大学,261
Unix 和401–402
路德维希,卡尔,375
Lumière, Antoine (父亲), 200
Lumière 兄弟, 195 , 196 , 451–452
遗产和神话, 165 , 199 , 200 , 449–452
作为任何语言的光的制造者,200–204
投影仪, 195
登月舱。见 阿波罗登月舱
里昂,理查德,52 岁
李森科的生物学,46
MAGI(数学应用集团公司),407–409、431、432、456
蓝天工作室和, 373 , 375 , 407 , 431 , 432 , 456
塞尔科、卡尔·路德维希和375
康奈尔大学,374
得到一个角色动画师,408
冰河时代,431
纽约理工大学和374、409、431 _
魔法飞跃,460
开始斯大林的秘密清洗,62
斯大林之后的苏联总理,62岁
二战后仅次于斯大林,62
计算和, 77 , 81 , 83 , 114 , 119 , 390 , 440
390的奇迹
80–81的概述和性质
Manchester Baby (“宝贝”), 122 , 125 , 128f , 137 , 152
1998 年重建/复制,125
动画和, 154
阴极射线管 ( CRT )和118、448、452
第一光和125 , 163 , 256 , 319 , 448
在历史背景下,117 , 120 , 128f , 133–136 , 142 , 448 , 451
汤姆·基尔本和118、122、124f、125、126、133、134、447、448 _ _ _ _ _ _ _ _ _ _
内存/位, 118 , 120 , 143 , 154 , 163 , 447 , 448
概述和性质,133–134
图片和, 125
皮克斯和125
阿尔维·雷·史密斯 (Alvy Ray Smith) 和125
弗雷迪·威廉姆斯和122 , 125 , 126 , 133 , 142 , 143
威廉姆斯管和, 122 , 142 , 143 , 447 , 448
疯子(电脑), 135–137 , 142 , 149 , 157
马可波罗,467
马雷,艾蒂安-朱尔斯
Georges Demenÿ 和, 198 , 199 , 201–202
马菲诺沙拉什卡
出现在第一圈,67
安置 Kotelnikov 的实验室,但不是 Kotelnikov,66–67
67 岁的索尔仁尼琴
在莫斯科北部,66
马克一世。见 曼彻斯特马克一世
麻省理工学院。见 麻省理工学院
矩阵代数,293
麦卡锡,约翰,465
麦卡锡,约瑟夫,79 岁
梅。见 莫斯科电力工程学院
记忆, 数字. 请参阅 帧缓冲区
华特迪士尼和, 166 , 221–222 , 286 , 452
Ub Iwerks 和, 221–222
微软字,389
明斯基,马文,465
麻省理工学院(麻省理工学院)。另见 画板;画板三;太空战争;TX-2;旋风
人工智能中心,465
罗恩·贝克尔 (Ron Baecker),298
万尼瓦·布什,253
史蒂夫·库恩斯 (Steve Coons),263–265
DAC-1 与 GM 合作,286
赫伯弗里曼,262
在156年首次验证计算机动画
黑客,258–259
林肯实验室 (Lincoln Lab), 276 , 284
PDP-1 在,259
辐射实验室(Rad Lab),253
52 岁的威廉·施赖伯
罗伯特·舒马克 (Robert Schumacker),321
克劳德·香农,254
精明营销,289
汤姆斯托克汉姆,259
弗雷德里克·特曼 (Frederick Terman),254
Triumvirate(萨瑟兰、约翰逊、罗伯茨)在(见 Triumvirate)
MITRE 公司,144
孙悟空项目359 , 416 , 417 , 420 , 430 , 456
猴子,394–396
穆勒,詹姆斯 A.(“安迪”),384
放大82 , 120 , 301–304 , 310 , 338 , 435 , 455 , 463
和数码灯,301
作为工程奇迹,8、311、432、437 _ _ _
时期 1 和 2 以及7、137、248、249、301–303、305、321
数量级版本,6、82、120、302、303、310、323、327、331、361、417、420、428、432、435、448、456、463 _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _
术语的由来,306
设定于 1965 年, 6 , 7 , 82 , 249 , 255 , 301–305 , 310 , 311 , 313 , 432
作为超新星,6 , 120 , 227 , 301–304 , 310 , 448 , 463
伊万·萨瑟兰和,306
摩尔定律加速,82 , 301–304 , 386 , 444
莫斯科高等技术学校,47
莫斯科动力工程学院 (MEI), 47 , 62 , 65 , 68 , 71
“电影。” 另请参阅 电影
术语的使用,176
电影,The(第一部数字电影),416。另见玩具总动员(电影)
成为焦点,428–429
电影,第一部数字电影(续)
大数字融合和,406
约翰·拉塞特和, 412–414 , 421 , 424 , 425 , 428
卢卡斯影业和407
和千禧年,456
摩尔定律和, 372 , 417–419 , 425 , 428 , 455 , 456
软件技术,417–419
用于制作的技术,401
三维人物模型,361
电影机, 182–183 , 190 , 204 , 226 , 450。另请参阅特定主题
差不多,176
电影放映机。查看 投影仪
电影)。另请参阅特定主题
第一个数字,4
框架作为样本,6
6–7的历史
理想(见 理想电影)
真人与动画,6
实时,443–445
术语,176
电影系统。查看 理想的电影系统
爱德华·迈布里奇 (Edward James Muggeridge), 166 , 166t , 191–192 , 220
别名, 166–167 , 166t , 169 , 173
165、191、198、450的表征_ _ _ _ _
计时摄影,198
帧和, 170 , 171 , 198 , 217 , 220
电影/电影和, 165 , 166 , 169–170 , 172 , 175 , 192 , 449
谋杀案审判,167
转描和,217
Leland Stanford 和, 167 , 169 , 172–175 , 198
动物运动镜,192
雅克-路易·大卫 (Jacques-Louis David) 的画作, 2 , 8
死亡,39
37-39年被流放到圣赫勒拿
最后的百日力量,37-39
傅立叶和, 35–37
傅立叶被38 岁
傅立叶被38 岁重新雇用
傅立叶的舞蹈,37-38
作为傅立叶的暴君,7-8
拿破仑定理,22
美国国家航空航天局(美国国家航空航天局),327
ARPA和254、307、314、454、455 _ _ _ _ _ _ _
彩色图形和314、316、330 _ _
GE 为314 , 316 , 319 , 320制造的飞行模拟器
资金来自,454
喷气推进实验室 (JPL) 和314
PARC 和455
Rod Rougelot 和, 320–322 , 331 , 334 , 339 , 455
鲍勃·舒马克和318 , 320–322 , 331 , 334 , 339 , 455
鲍勃·泰勒 (Bob Taylor),电话:293 , 454
NASA-1, 316–318 , 320 , 321 , 331
NASA-2, 309f , 320–322 , 331 , 343–345 , 357
国家艺术基金会 (NEA),355–356
纳粹德国, 85 , 97 , 253 , 300 , 307 , 344 , 451 , 454
谜码,378
神经网络,464–465
Nevzorov 姐妹(Zinaida、Sophia、Avgusta、Olga),62 岁
纽厄尔,马丁,244、246、274、351、369 _ _ _ _ _
纽曼,林恩(麦克斯的妻子),103
生活史和概述,103
图灵和, 87–89 , 98 , 101 , 103 , 104 , 132–134
威廉姆斯管和,142
纽曼, 威廉 (Max 的儿子), 114 , 135 , 350
纽曼 Laugh-O-grams,220
牛顿物理学和中心法则,7 , 327 , 418 , 457 , 459
纽约理工学院 (NYIT), 261 , 330 , 455
Ed Catmull 和355 , 357 , 368 , 371 , 372 , 377 , 382 , 383 , 402 , 409 , 417
cel动画和,219
大卫·迪弗朗西斯科和, 355 , 375 , 379 , 383 , 402
拉尔夫·古根海姆( Ralph Guggenheim ) ,电话:374、381、382、433
卢卡斯影业的秘密旅行,381–384
NEA(国家艺术基金会)和355–356
马丁纽厄尔和,351
亚历克斯·舒尔和219、352、354、355、363、374、378、383、385、402、417、455、456
阿尔维·雷·史密斯和,352
加兰斯特恩电话:359、361–363、369、376、377 _ _ _ _ _
NKS。见 人民通讯委员会
NKVD(内务人民委员部),61
作为克格勃的前身,61
奈奎斯特, 哈里, 45–46 , 52 , 445–446
奈奎斯特-香农采样定理。参见 采样定理
官方保密法,艾伦·图灵和,78–80 , 120–121 , 446 , 451
“关于可计算数,应用于Entsheidungsproblem ”(Turing,1936),89 , 100
阿朗佐教堂和88
存储程序计算机和107 , 117 , 127 , 447 , 451
通用图灵机,96
Kotelnikov 和 Shannon 证明的可靠性,65
由 Amtorg 使用,65
奥本海默,J.罗伯特,73 岁
ORDVAC(军械离散变量自动计算机),157
奥斯比,埃本,402
Out of the Inkwell(电影系列),218–219
产生梦工厂和Antz , 430–431
艾尔帕西诺,462
油漆3、364、372、377、385、417 _ _ _ _ _ _ _ _
帕莱,约瑟夫,13 岁
天堂岛。见 沙拉什卡
PARC(帕洛阿尔托研究中心),258-259,455。另请参阅施乐 PARC
断腿导致,344
中心教条和,355
彩色视频系统和,343
大卫·迪弗朗西斯科和,356
纽约理工学院 (NYIT) 和330
p曲线,299
PDI。查看 太平洋数据图像
像素与像素,51–52
人民通讯委员会(NKS),47-48
解散,除了科捷尔尼科夫的实验室,62
Pére Lachaise 公墓,39–40
看法
威廉费特和,281–284
拉里·罗伯茨和, 281 , 284 , 290 , 305 , 410
爱德华·扎雅克和,283–284
透视视口。见 视口
佩西,乔,462
彼得大帝,46 岁
Phong 阴影,342
Photoshop (Adobe), 60 , 61 , 61f , 261 , 262
Alpha 通道和368
钢笔工具, 272
像素和, 58 , 60 , 105 , 241 , 459 , 464
图片
和显示,分离,2
与中等,2
面向图片的计算机图形学,443
图片与中等,2
飞行员王牌, 132 , 142 , 143 , 148 , 152 , 447
皮特,布拉德,461
分娩痛,421–422
大写字母和219、424、450 _ _
Ed Catmull 和219 , 240 , 355 , 374 , 421 , 429 , 431 , 433 , 460
中心教条和,417–418
理查德·德莱福斯和,460–461
财务, 421–423 , 425 , 428 , 429 , 433
大数字融合,432
史蒂夫乔布斯和, 423 , 425 , 429 , 433 , 456–457
约翰·拉塞特和, 226 , 407 , 413 , 414 , 421 , 424 , 425 , 433
卢卡斯影业和, 219 , 330 , 373–374 , 416 , 423 , 425 , 427 , 429 , 456
卢卡斯影业诞生,419–423
组织文化, 416
278 , 348 , 355 , 402 , 406 , 411 , 423 , 430 , 455 , 456的起源和共同创立
由 Ed Catmull 和 Alvy Ray Smith 共同创立,219 , 240 , 374 , 431
不是由史蒂夫乔布斯共同创立的,433
RenderMan、Reyes 和425–427
亚历克斯舒尔和,433
阿尔维·雷·史密斯 (Alvy Ray Smith) 离开,428
子样本位置,326
玩具总动员和, 4 , 93 , 243 , 252 , 406 , 407 , 429 , 433 , 456
皮克斯动画师,172、210、461 _
皮克斯图像计算机, 386 , 420 , 421 , 423 , 424
类似皮克斯的电影,242–245
皮克斯电影,281、290、429、430、444 。_ _ _ _ _ _ 另见电影,The ; 玩具总动员
短裤,424
Pixar Touch: The Making of a Company, The (Price), 374
像素)
16位灰度就够了,69
双三次像素散布器,57-58
位和,2
特征, 51
定义, 51
与显示元素,4
没有形状,5
隐形, 2 , 4 , 5 , 63 , 74 , 311 , 436
是一个数字化样本,68
不是正方形,5
必须传播它才能看到它,60
只有散布像素有形状,60
术语的由来,51
与 pel,51–52
像素化是一种误解,51
小方块错觉之源,60
术语,51-52
视觉样本,5
像素化,51
像素扩展器,57–60 , 138 , 180。另见 撒布机;散布像素
数码灯和,63
理想,180
像素和,31
托马斯·波特(“汤姆”),398f , 400f , 404 , 409 , 418
卢卡斯影业和, 231 , 241 , 368 , 385 , 399 , 403
RGBA 绘画程序,385
阿尔维·雷·史密斯 (Alvy Ray Smith) 和, 385 , 401
价格,大卫,374
John von Neumann at, 89 , 97–98 , 101 , 108 , 135 , 136(另见 Von Neumann 团队)
投影灯,180
投影仪,176、183、197、203、204。_ _ _ _ _ _ 另见电影摄影;幻灯
WKL 迪克森和, 192 , 195 , 196 , 204 , 451
数字, 176
爱迪生、迪克森和, 192 , 195–197 , 204 , 451
帧和, 180–183
它们是如何工作的,183
理想,180–182
Athanasius Kircher 和,170
电影机,450
Proletariat, The (Cook, Carpenter, and Porter), 399 , 401 , 418
普京, 弗拉基米尔, 43 , 75 , 466 , 466f
R-1(导弹)
作为俄罗斯版的德国 V-2, 68
使用 MEI-Kotelnikov 无线电系统,68
R-7(导弹)
作为第一个俄罗斯洲际导弹,68
使用 MEI-Kotelnikov 遥测系统,68
拉贝,赫伯特,45 岁
雷达,386
光栅显示,277
扩展像素和, 139 , 141 , 247–248 , 278
实时计算机图形/实时渲染。请参阅 交互式渲染的计算机图形
“实时”,该术语的含义,259–260
Reeves , William T.(“比尔”),402、403、406
约翰·拉塞特和, 416 , 421 , 424 , 425 , 428
相对论,爱因斯坦的广义理论,12
渲染人,425–427
雷耶斯渲染,425–427
RGBA,放大,385–386
RGBA漆,385
RGBA画图程序,第一,385
RGBA 像素,365–367
RGB 滑块,345
罗伯茨,劳伦斯·吉尔曼(“拉里” ),276、291-292、327-328 。又见三驾马车
ARPA、IPTO 和294
蒂姆·约翰逊和, 276 , 279 , 281 , 284 , 290–292
透视和, 281 , 284 , 290 , 305 , 410
294人担任的职位
作为文艺复兴时期的人,291–293
画板III和276、279、292、457 _ _ _ _
罗森达尔,卡尔,409
Rougelot, Rodney S.(“罗德”)
颜色像素和321 , 331 , 344 , 357 , 455
计算机辅助运筹学设施 (CAORF) 和357
在康奈尔大学,320–321
在埃文斯和萨瑟兰,321
由321创建的飞行模拟器
唐·格林伯格和, 320–321 , 331 , 334 , 374 , 455
NASA - 1和320、331、339 _
鲍勃·舒马克和321 , 322 , 331 , 334 , 339 , 344 , 357 , 455
卢梭,让-雅克,13 岁
皇家学会, 39 , 77 , 122 , 174 , 234
鲁宾,迈克尔,373–374
俄罗斯科学院,46
俄罗斯内战,47
Sage (计算机), 256–257 , 261 , 289
萨哈罗夫,安德烈·德米特里耶维奇,72岁
样本与像素,318
采样,历史,5
采样定理,43。另见 Shannon, Claude Elwood
模拟与数字和, 44 , 49 , 50–51 , 59 , 64 , 74
抗锯齿和161–163
索赔人,43
取决于傅立叶, 5 , 74 , 235 , 438 , 445
首次亮相(1933 年),45
Kotelnikov,不是奈奎斯特,445–446
Kotelnikov,不是香农,43 , 52–53 , 75 , 445–446
数学奇迹,437
不是真的什么都没有,59
像素分布和添加每,76
1933 年被 Kotelnikov 证明,5 , 53 , 98 , 105 , 158 , 437
恢复、扩展像素并添加,55
重新包装无限,59
反过来(惠特克),306
以最高频率的两倍采样,50–51
样本是离散的、不连贯的、分离的、50–51
扫描,349
辛德勒的名单(电影),300
施赖伯,威廉,52 岁
Schumacker, Robert A. (“Bob”), 321–322 , 455
Ed Catmull 和,357
计算机辅助运筹学设施 (CAORF) 和357
教育, 321
在 Evans & Sutherland (E&S), 321 , 357
由321创建的飞行模拟器
在通用电气,318、321、322、331、357、455 _ _ _ _ _ _ _
NASA - 1和318、321、331、339 _ _ _
NASA-2 和320–322
罗德·鲁格洛和,321 , 322 , 331 , 334 , 339 , 344 , 357 , 455
亚历山大·舒尔(“亚历克斯叔叔”),381
Alpha 通道和363
Ed Catmull 和, 219 , 354 , 355 , 378 , 379 , 402
351的表征
计算机图形学和353–354
康奈尔大学,374
埃文斯和萨瑟兰 (E&S) 和353–355
约翰尼根特和,219
纽约理工大学和219、352、354、355、363、374、378、383、385、402、417、455、456 _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _
绘画程序和385
照片,352f
皮克斯和,433
光栅图形和351–354
阿尔维·雷·史密斯和, 219 , 351 , 363 , 378 , 379 , 383 , 385
Tubby the Tuba和219 , 353 , 354 , 417 , 456
半自动地面环境。见 鼠尾草
麻省理工学院伺服机构实验室 (Servo Lab), 253 , 262
作为概念上的飞跃,388–390
RenderMan, 425–427
术语, 427
尚卡尔,拉维
描述和概述,231
香卡,拉维(续)
Alvy Ray Smith 的样条演示,用于231–234 , 236–238 , 240 , 241 , 243 , 265 , 272 , 306 , 307 , 348 , 385
分析了二战中的 X 系统,53
背景和早年生活,53
出生于密歇根州,53 岁
密码学和53
没有提到科捷利尼科夫,53
第一个在打印中使用字位, 45
Kotelnikov 和, 53 , 54 , 54f , 75–76 , 101 , 235 , 445
密码大师,53 岁
在麻省理工学院,254
从未声称过采样定理,43 , 53 , 75 , 445–446
哈里奈奎斯特和,45–46
与科捷利尼科夫的成就相似,54
作为一个顽皮的天才,53
采样定理和,53-54
158推广的采样定理
传播理论,53
图灵和, 77–78 , 104 , 111 , 152 , 158
图灵机和,111
语音加扰器和104
获得最高奖项,54
著作,52-53
沙拉什卡,43 岁,66-68岁。另请参阅 Marfino sharashka
Shesternin, Sergei (Sophia Nevzorova 的丈夫), 62
小学馆, 416
Shoup, Richard G. (“迪克”), 248 , 343–345
电脑鼠标和, 347
第一次完全抗锯齿,162
阿尔维·雷·史密斯( Alvy Ray Smith )和344、350、363、378
马车车轮图片,162
Siggraph (计算机图形和交互技术特别兴趣小组)会议,305、394、400、415。又见浣熊奖
André & Wally B. and, 414 , 415
吉姆·布林,370
Loren Carpenter、Ed Catmull 和386
成立, 267
伯特·赫尔佐格和,267
比尔·里夫斯和,402
动画和294–295
史蒂夫库恩斯和,285
电影演示,289
通用汽车和285
图形显示,285
交互式渲染的 2D 计算机图形,287–289
伊万·萨瑟兰和, 261 , 275–277 , 284–290 , 294–295 , 453–454
Tim Johnson 经常与 Sutherland 混淆,275 , 290
TX - 2和284、287–289
中心教条和305
DAC - 1和285–286、454
交互式渲染 3D 计算机图形,287–289
蒂姆·约翰逊和, 275–276 , 279 , 290–292 , 454 , 457
拉里·罗伯茨和, 276 , 279 , 292 , 457
史密斯,林恩,299
SoftCel(“扫描和绘制”系统),362
索尔仁尼琴,亚历山大,43 岁
在 sharashkas 上,66
染谷功,45岁
声音样本。见 索克塞尔
前苏联。见莫斯科
关于足够位数的争论,69-70
定义, 52
数字声音和,63
词源,52
必须传播它才能听到它,63
像素和, 55 , 57 , 59 , 105 , 165 , 166 , 235
太空战争(游戏), 257–259 , 261 , 299 , 343
样条,239f
Loren Carpenter 的多维,405
曲线和, 232 , 237–238 , 240 , 242 , 243 , 265 , 272 , 274
数码灯和,239
插值、近似和231 , 234 , 240 , 265 , 272 , 274 , 306–307 , 342
隐形, 241
它通过的点, 232–234 , 238–239 , 239f , 272 , 274 , 306
在实践中,239–240
Ravi Shankar 的样条演示, 231–234 , 236–238 , 240 , 241 , 243 , 265 , 272 , 306 , 307 , 348 , 385
点和散布像素,122 , 137 , 139 , 145 , 148
吊具,44–46
在展示行为中,63
一团无穷大,59
最早的照片,44-45
理想, 56 , 58 , 59 , 63 , 180 , 235 , 239–240
是模拟的,59
现实世界与理想世界,56
作为工程师的重建滤波器,44
数学家的 sinc 函数,44
Bresenham 算法和247–248
书法展示,书法设备,以及,139 , 141 , 148 , 247 , 278
60 , 64 , 122 , 143 , 436的特征和性质
彩色像素和311
First Light(第一张数码照片)、Kilburn和118、122
几何模型和, 241 , 242 , 245 , 246 , 256
扩展像素(续)
肯·诺尔顿和,296–297
光枪和,145
光栅动画和,156
光栅显示和, 139 , 141 , 247–248 , 278
点和, 122 , 137 , 139 , 145 , 148
Sproull,罗伯特(“鲍勃”),321
壁球和拉伸,213–216
216-217年阿尔维·雷·史密斯 (Alvy Ray Smith) 的洗礼
圣彼得堡科学院,46
在第一圈,67
马林科夫、贝利亚和61–62
偏执狂,要求声码器,67
秘密清洗,61
斯坦福,利兰,166
农场,169
财务,175
艾蒂安-朱尔斯·马雷和,198
爱德华·迈布里奇和, 167 , 169 , 172–175 , 198
斯坦福大学, 167 , 169 , 254 , 382 , 384 , 465
阿尔维·雷·史密斯 (Alvy Ray Smith) 在, 42 , 45 , 262 , 344 , 465
星际迷航 II:可汗之怒(电影),403–406。另见 创世纪演示
星球大战 (电影), 381 , 382 , 384 , 411 , 415 , 456
立体视觉,242、260、305、432、458。_ _ _ _ _ _ 另见头戴式显示器
动画和, 359 , 361–362 , 376 , 377
在纽约理工大学,359 , 361–363 , 369 , 376 , 377
Unix 和373
斯蒂格勒的同名法,45
臭味与塔。参见 Tower vs. stinks
斯托克汉姆,托马斯(“汤姆”),162–163 , 259 , 359
Strachey, 克里斯托弗, 113 , 152 , 287
子像素,325
子样本,325
帧缓冲区和343–348
萨瑟兰,伊万·爱德华,278、296、305、306、354、453、454。_ _ _ _ _ _ _ 另见头戴式显示器;三驾马车
成就,284–289
动画和294–295
ARPA和294、296、355、454 _ _ _ _ _
增强现实 (AR) 和305
奖项, 269
以及虚拟现实 (VR) 的诞生,304–305、306f(另见 头戴式显示器)
Bresenham 算法求解,289
关于漫画方法,295
计算机辅助设计 (CAD) 和285 , 289 , 294
史蒂文·库恩斯和, 263 , 265 , 269 , 276 , 284 , 285
描述, 284
David Evans and, 261 , 278 , 294 , 296 , 454(另见Evans & Sutherland)
闪烁和, 278
IPTO 和294
蒂姆·约翰逊和, 263 , 275 , 285 , 289–291 , 294
摩尔定律和,306
290张照片
画板和, 261 , 275–277 , 284–290 , 294–295 , 453–454
1963 年写生论文,294-295
阿尔维·雷·史密斯和, 284 , 289 , 305 , 321 , 354
TX - 2和277、284–285、287–289、299 _ _ _
犹他大学和, 117 , 261 , 294 , 296 , 454
ARPA、IPTO 和294
纽约理工大学和355
阿尔维·雷·史密斯和,294
施乐PARC和294、343、355、454 _ _ _ _
照片,244f
在自由卷, 386
电传打字机,160
电传艺术时代,161
电传图片,160–161
电传打字机,160
电视,186
特曼,弗雷德里克,254
35 毫米电影胶片, 196 , 201 , 203 , 384
三维 (3D) 查看器。见 立体镜
倾斜刷(谷歌),459
托尔斯泰,狮子座,165
作为喀山大学的学生,46 岁
塔与臭味,8 , 88 , 126 , 132 , 133 , 175 , 202 , 225–226 , 461
宝贝和,133
赫伯弗里曼和,344
王子学院和, 135–136
技术上与艺术创意的人,8
约翰·冯·诺依曼和,136
玩具总动员(电影), 4 , 6–7 , 252 , 429。另见 电影,
角色动画,210
作为第一部数字电影,4、6、429、456 _
拉尔夫古根海姆和,433
皮克斯和, 4 , 93 , 243 , 252 , 406 , 407 , 429 , 433 , 456
创和,407
三角形
扩增和243–246 , 307 , 322 , 329 , 337 , 386–387 , 387f
Triple-I (Information International Inc.), 407 , 409–411
三巨头(萨瑟兰、约翰逊和罗伯茨),276f、281、285、294、314、454
以及被遗忘的计算机图形学历史,275–276
TX-2 和277
Tubby the Tuba (电影), 354 , 379
亚历克斯·舒尔和219、353、354、417、456 _ _ _ _
在布莱切利公园, 78 , 80 , 92 , 101–104 , 111 , 113
计算,446
创造力和, 461
与莫里斯·威尔克斯的敌意,134
以及计算机的发明,447、448、451、461 _ _
汤姆·基尔本和133、134、150、158 _ _
在国王学院,463–464
马克斯纽曼和, 87–89 , 98 , 101 , 103 , 104 , 132–134
原谅,79
飞行员王牌, 132 , 142 , 143 , 148 , 152 , 447
克劳德·香农和, 77–78 , 104 , 111 , 152 , 158
eProblem 的解决方案, 87–89 , 106 , 440
约翰·冯·诺依曼和, 98 , 100 , 101 , 118 , 119 , 131 , 134 , 135 , 446 , 448 , 451
动画,Ron Baecker,以及,298、299、371
网格上的书法展示,277–278
伊万·萨瑟兰和, 277 , 284–285 , 287–289 , 299
暴君,428。另见理念-混乱-暴君
跳舞,72-74
大恐怖及其,61-62
Ub Iwerks 工作室,222
环球影城,205
加州大学伯克利分校,294
人工智能研究实验室,464
犹他大学, 261 , 330 , 331 , 351 , 359 , 369 , 455
动画和, 296
吉姆·布林(Jim Blinn) ,电话:331、369、370
Ed Catmull 和, 261 , 317 , 334 , 354 , 357 , 369 , 371 , 410
由大卫·埃文斯 (David Evans) 创立,294 , 296 , 454
Tom Stockham 在259年教图形师
伊万·萨瑟兰和, 117 , 261 , 294 , 296 , 454
使用采样定理进行空间抗锯齿,162-163
Unix, 372
加拿大人,372–373
卢卡斯影业和,401–402
Unix 专家。另见 达夫,汤姆
成为图形向导,401–402
不可知性、计算和107
范德贝克,斯坦,355–356
视口,278–279
猴面包树工作室和458
启用摩尔定律,305
Vitascope, 190 , 196 , 204。另见 幻影镜
声码器
由虚构的 Abakumov 描述,67
作为语音扰频器,67
索尔仁尼琴在 Marfino 工作,67
自由卷(短片),386
冯·诺依曼,约翰(“约翰尼”),126。另见 Edvac 报告
数码光和,98
和哥德尔,100
IBM 和142
约翰梅纳德凯恩斯和,113
威廉纽曼和,113
在 Princetitute, 89 , 97–98 , 101 , 108 , 135 , 136(另见 冯诺依曼队)
图灵和, 98 , 100 , 101 , 118 , 119 , 131 , 134 , 135 , 446 , 448 , 451
威廉姆斯管和,142
冯诺依曼架构, 98 , 130 , 131 , 134 , 135 , 448
冯诺依曼团队,118、131、135、137、141、447。_ _ _ _ _ _ 另见Edvac 报告
虚拟现实。见 虚拟现实
华特迪士尼公司。见 迪士尼
傅里叶开, 4 , 7 , 18 , 30 , 31 , 33 , 35 , 50 , 74 , 177 , 179 , 437
热流作为 a, 35
感官世界作为一个,4
视觉世界 a, 4 , 7 , 23–25 , 30 , 31 , 33–34 , 50 , 177 , 179 , 437
韦恩,马塞利,262、300、301、359、454 _ _ _ _ _
韦恩,狼,300
查理斯·亚当斯和,154–155
动画和, 154–156 , 155f , 256 , 282 , 449 , 452
Whirlwind 上显示的第一部计算机动画,157
编程手册中的“弹跳球显示”,154
书法展示,158
书法图片来自,150–151,150f
发展, 253
数码灯和,144
赫伯弗里曼和,262
在历史背景下,256
显示的数学曲线,252
内存和, 144
编程,156
速度要求,144
拨动开关和, 144
版本,137
威廉姆斯管和,144
旋风–(“旋风减”),137 , 144–146 , 155 , 156
旋风摄影档案,144
白卫兵(布尔加科夫),47
Whitney, John, Jr., 318 , 407 , 409–411
家庭, 318
惠特克, 埃德蒙·泰勒, 45 , 234–236 , 239 , 240 , 275 , 453
威廉姆斯,弗雷德里克卡兰(“弗莱迪”)。另见 威廉姆斯管/Williams-Kilburn 管
Baby and, 122 , 125 , 126 , 133 , 142 , 143(另见 曼彻斯特宝贝)
背景,121
由118创建的第一台数码灯
荣誉, 122
对计算机设计的影响,127
汤姆·基尔伯恩和, 117 , 118 , 122 , 126 , 127 , 132–134 , 141 , 447
关于马克斯纽曼,133
智胜 IBM,142–143
照片,118f
在曼彻斯特大学, 121 , 122 , 132 , 133
冯诺依曼架构和,134
威廉姆斯,兰斯,369
和抗锯齿光栅图像,359
在纽约理工大学,369、376、416、418 _ _
阿尔维·雷·史密斯 (Alvy Ray Smith) 和, 358–359 , 416
威廉姆斯管/Williams-Kilburn 管, 137 , 143 , 148
宝贝和, 122 , 142 , 143 , 447 , 448
朱利安毕格罗和,142
阴极射线管 ( CRT )和137、141–144、448
棋盘显示在,152
埃德萨克和,143
电子存储器和, 447
对计算机设计的影响,127
汤姆·基尔本,122
奥德瓦克和,157
Selectron 和141–142
术语,122
旋风和,144
赢得记忆竞赛,141–142
早期计算机图形学中的女性,357,403。另见巴顿,克里斯汀
第一次世界大战,46
Xerox PARC(帕洛阿尔托研究中心),330、344、374、375、455。_ 另见PARC
迪克舒普和, 343 , 344 , 350 , 363 , 403
鲍勃·泰勒 (Bob Taylor),343
Bob Taylor 的实验室,电话:294 , 355 , 454
XR(扩展现实),460
Youngblood, 基因, 313 , 314 , 318–320。另请参阅扩展影院
Zephyr(计算机)。见 斯瓦克